В последние недели полторы много обсуждали решения задач из списка Эрдёша с… — @seeallochnaya

В последние недели полторы много обсуждали решения задач из списка Эрдёша с помощью GPT-5.2 Pro. Google DeepMind тоже не спит, и сегодня выпустили статью с доказательством новой теоремы в алгебраической геометрии с помощью внутренней математической специализированной версии Gemini. Я в математике вообще не шарю, поэтому научной стороны статьи касаться не будем. Интересно было разобраться, как выглядел процесс и насколько он автоматический. Тезисно: — Авторы использовали декомпозицию, разложив сложную теорему на серию более простых подзадач — Сначала модели скармливали простые частные случаи чтобы проверить, понимает ли она определения. В промптах прям так и пишут, «Чтобы убедиться, что ты меня понимаешь, скажи, какие ... ты бы выбрал» — Когда модель застревала, авторы не просто перезапускали генерацию заново. Они анализировали частично правильный вывод, находили в нем здравое зерно, и писали новый промпт: «Попробуй использовать вот эту стратегию, которую ты нащупал в прошлом шаге, но для общего случая». — Успешные доказательства простых подзадач подавались в контекст (историю чата) для решения более сложных. По сути пришлось придумать «лестницу» задач от простых к сложным, чтобы модель могла по ней подняться. — В ходе работы использовали систему над моделью, FullProof, однако деталей её устройства нет. Наверное что-то схожее с Pro-моделью OpenAI / DeepThink — Авторы вручную вычитывали генерации модели на почти всех шагах. Например, они заметили, что в одном из частных решений модель сделала неочевидное наблюдение. Человек со знанием домена это верифицировал и сказал модели: «Это крутая идея, используй её для всего остального». Ravi Vakil, американский математик в области алгебраической геометрии и президент American Mathematical Society, сказал: — Как человек, знакомый с литературой по теме, я обнаружил, что аргументация Gemini не была простым пересказом существующих доказательств; это была идея такого уровня, которой я бы сам гордился. Хотя я, возможно, в конечном итоге пришел бы к этому выводу самостоятельно, я не могу утверждать это с уверенностью. Мой главный вывод заключается в том, какой значимый математический прогресс возник благодаря этой синергии человеческой изобретательности и Gemini.

Из этого канала