Я уже писал, а вы наверняка читали про список Эрдёша — набор из 700+ открытых… — @seeallochnaya

Я уже писал, а вы наверняка читали про список Эрдёша — набор из 700+ открытых математических задач. Из этого списка несколько задач уже были решены ИИ — некоторые через непосредственно доказательство, некоторые через подсказку идей людям, а другие — за счёт поиска в литературе. Иногда так бывает, что доказательства были спрятаны и встречались просто как промежуточный шаг в вообще ортогональных работах (да ещё и не на английском). Поэтому одним из больших вопросов, который висел в воздухе, было наличие доказательств для других задач в интернете. В январе Google выпустили статью, в которой основательно взялись за список Эрдёша — они запустили большой пайплайн на основе DeepResearch с целью поискать уже имевшиеся решения + сгенерировать новые. Многие из кандидатов — воронку вы видите на картинке — были оценены математиками, и в конечном итоге это вылилось в 13 корректных решений (9 — на основе существующей литературы). В твиттере я спросил будущего сотрудника OpenAI и первого человека, который с помощью ChatGPT Pro нашёл ИИ-решение для задач Эрдёша и FrontierMath OpenProblems, можно ли сказать, что по сути тут мы закрываем список уже решенных задач, и всё, что будет дальше — это абсолютно новые доказательства (тут ещё вспомним, что Google видит самую большую долю интернета по сравнению с кем либо, в ~3 раза больше OpenAI и ещё больше по отношению к другим игрокам; так что если не нашли они — вероятно, не найдет никто). Он ответил: «Я думаю, что в плане полных прямых решений мы, вероятно, нашли их все с достаточно высокой степенью достоверности. Менее ясны частичные результаты/косвенные решения, когда ответ следует из применения известной теоремы и т. д.» === Сегодня OpenAI опубликовали статью, в которой обнародовали ещё 3 решения от некой внутренней модели. Там же они пишут: «Имея доказательства, мы решили проверить, сможет ли GPT 5.4 Pro воспроизвести их; верхнюю границу в первом результате и третий результат нам удалось получить. В каждом случае мы выполнили менее 10 идентичных попыток с Pro-моделью; наш второй результат не был решен Pro-моделью». Задачи не относятся к тем, где доказательства были найдены в интернете ранее (иначе б они не оставались открытыми). Эти 3 решения пока отнесём к категории «ничего особенного», но по-видимому всё, что будет дальше, уже достаточно сложно + почти наверняка не имеет ответов в литературе.

Из этого канала