Я уже писал, а вы наверняка читали про список Эрдёша — набор из 700+ открытых математических задач. Из этого списка несколько задач уже были решены ИИ — некоторые через непосредственно доказательство, некоторые через подсказку идей людям, а другие — за счёт поиска в литературе. Иногда так бывает, что доказательства были спрятаны и встречались просто как промежуточный шаг в вообще ортогональных работах (да ещё и не на английском). Поэтому одним из больших вопросов, который висел в воздухе, было наличие доказательств для других задач в интернете. В январе Google выпустили статью, в которой основательно взялись за список Эрдёша — они запустили большой пайплайн на основе DeepResearch с целью поискать уже имевшиеся решения + сгенерировать новые. Многие из кандидатов — воронку вы видите на картинке — были оценены математиками, и в конечном итоге это вылилось в 13 корректных решений (9 — на основе существующей литературы). В твиттере я спросил будущего сотрудника OpenAI и первого человека, который с помощью ChatGPT Pro нашёл ИИ-решение для задач Эрдёша и FrontierMath OpenProblems, можно ли сказать, что по сути тут мы закрываем список уже решенных задач, и всё, что будет дальше — это абсолютно новые доказательства (тут ещё вспомним, что Google видит самую большую долю интернета по сравнению с кем либо, в ~3 раза больше OpenAI и ещё больше по отношению к другим игрокам; так что если не нашли они — вероятно, не найдет никто). Он ответил: «Я думаю, что в плане полных прямых решений мы, вероятно, нашли их все с достаточно высокой степенью достоверности. Менее ясны частичные результаты/косвенные решения, когда ответ следует из применения известной теоремы и т. д.» === Сегодня OpenAI опубликовали статью, в которой обнародовали ещё 3 решения от некой внутренней модели. Там же они пишут: «Имея доказательства, мы решили проверить, сможет ли GPT 5.4 Pro воспроизвести их; верхнюю границу в первом результате и третий результат нам удалось получить. В каждом случае мы выполнили менее 10 идентичных попыток с Pro-моделью; наш второй результат не был решен Pro-моделью». Задачи не относятся к тем, где доказательства были найдены в интернете ранее (иначе б они не оставались открытыми). Эти 3 решения пока отнесём к категории «ничего особенного», но по-видимому всё, что будет дальше, уже достаточно сложно + почти наверняка не имеет ответов в литературе.
Я уже писал, а вы наверняка читали про список Эрдёша — набор из 700+ открытых…
Из этого канала
- #3492Запуск Artemis II ровно через полчаса тут:…
Запуск Artemis II ровно через полчаса тут: https://www.youtube.com/watch?v=TfUjBMIzNo За 10-дневную миссию космонавты облетят Луну, а человечество поставит…
- #3494Google выпускают обновление линейки Gemma — стала доступна версия с номером 4…
Google выпускают обновление линейки Gemma — стала доступна версия с номером 4 https://deepmind.google/models/gemma/gemma-4/ Всего доступны модели 4 размеров:…
- #3496На первой картинке — рост количества ежедневных визитов на claude.ai с начала…
На первой картинке — рост количества ежедневных визитов на claude.ai с начала года от Similarweb.
- #3490Погодите, это реально?
Погодите, это реально?
- #3489Со стороны защиты в целом доступны те же инструменты — агенты для чтения всего…
Со стороны защиты в целом доступны те же инструменты — агенты для чтения всего кода и изменений в нём.