Агент Cursor решил одну из задач First Proof challenge лучше, чем люди First Proof challenge – это набор из 10 математических задач, составленный 11 известными математиками (включая лауреата Филдсовской премии Мартина Хайрера). Задачи там из областей алгебраической комбинаторики, спектральной теории графов, топологии, стохастического анализа и тд. Они имитируют реальную работу академиков лучших университетов мира. Задачки были составлены всего лишь месяц назад и открыто не публикуются во избежании лика данных в трейн моделей. И вот сегодня CEO Cursor заявил, что их агент (для кодинга, на секундочку) справился с одной из этих задач, и нашел при этом лучшее решение, чем люди. Это подтверждают математики: подход агента действительно отличается от существующего и улучшает доказательство до новой константы. Что интересно, тут использовалась ровно та же система, с помощью которой Cursor с нуля завайбкодили браузер (пост об этом вот тут). Она автономно работала над задачей четыре дня, не получая никаких подсказок. Под капотом там, кстати, не один, а десятки агентов на основе разных моделей, которые динамически планируют действия и работают над подзадачами.
Агент Cursor решил одну из задач First Proof challenge лучше, чем люди First…
Из этого канала
- #8819Notebook LM от Google теперь умеет создавать целые документалки из ваших…
Notebook LM от Google теперь умеет создавать целые документалки из ваших источников Они выкатили фичу Cinematic Video Overview.
- #8820Как фактчекнуть любой пост в Telegram за несколько секунд Telegram – один из…
Как фактчекнуть любой пост в Telegram за несколько секунд Telegram – один из главных источников новостей.
- #8821Что и требовалось доказать: Дженсен Хуанг во всеуслышание заявил, что его…
Что и требовалось доказать: Дженсен Хуанг во всеуслышание заявил, что его недавние инвестиции в OpenAI и Anthropic, вероятно, будут последними для обоих Хотя…
- #8817В OpenAI разрабатывают альтернативу GitHub Об этом пишут Reuters. Инженеры…
В OpenAI разрабатывают альтернативу GitHub Об этом пишут Reuters. Инженеры стартапа якобы начали сталкиваться с большим количеством сбоев и неудобств при…
- #8815Т-Банк инвестирует в школьное IT-образование через поддержку учителей Бигтех…
Т-Банк инвестирует в школьное IT-образование через поддержку учителей Бигтех открыл прием заявок на четвертый сезон Всероссийского грантового конкурса «Вклад в…