В последние недели полторы много обсуждали решения задач из списка Эрдёша с помощью GPT-5.2 Pro. Google DeepMind тоже не спит, и сегодня выпустили статью с доказательством новой теоремы в алгебраической геометрии с помощью внутренней математической специализированной версии Gemini. Я в математике вообще не шарю, поэтому научной стороны статьи касаться не будем. Интересно было разобраться, как выглядел процесс и насколько он автоматический. Тезисно: — Авторы использовали декомпозицию, разложив сложную теорему на серию более простых подзадач — Сначала модели скармливали простые частные случаи чтобы проверить, понимает ли она определения. В промптах прям так и пишут, «Чтобы убедиться, что ты меня понимаешь, скажи, какие ... ты бы выбрал» — Когда модель застревала, авторы не просто перезапускали генерацию заново. Они анализировали частично правильный вывод, находили в нем здравое зерно, и писали новый промпт: «Попробуй использовать вот эту стратегию, которую ты нащупал в прошлом шаге, но для общего случая». — Успешные доказательства простых подзадач подавались в контекст (историю чата) для решения более сложных. По сути пришлось придумать «лестницу» задач от простых к сложным, чтобы модель могла по ней подняться. — В ходе работы использовали систему над моделью, FullProof, однако деталей её устройства нет. Наверное что-то схожее с Pro-моделью OpenAI / DeepThink — Авторы вручную вычитывали генерации модели на почти всех шагах. Например, они заметили, что в одном из частных решений модель сделала неочевидное наблюдение. Человек со знанием домена это верифицировал и сказал модели: «Это крутая идея, используй её для всего остального». Ravi Vakil, американский математик в области алгебраической геометрии и президент American Mathematical Society, сказал: — Как человек, знакомый с литературой по теме, я обнаружил, что аргументация Gemini не была простым пересказом существующих доказательств; это была идея такого уровня, которой я бы сам гордился. Хотя я, возможно, в конечном итоге пришел бы к этому выводу самостоятельно, я не могу утверждать это с уверенностью. Мой главный вывод заключается в том, какой значимый математический прогресс возник благодаря этой синергии человеческой изобретательности и Gemini.
В последние недели полторы много обсуждали решения задач из списка Эрдёша с…
Из этого канала
- #3283Я пропустил, а оказывается AI Digest подвели итоги формы предсказаний, которую…
Я пропустил, а оказывается AI Digest подвели итоги формы предсказаний, которую запускали в конце 2024-го года на 2025-й.
- #3284GPT-5.2 Pro конечно умная, но иногда медленная — не для каждого вопроса я готов…
GPT-5.2 Pro конечно умная, но иногда медленная — не для каждого вопроса я готов ждать по 20-30 минут ответа.
- #3285Так как посты два раза никто не читает, то напишу отдельно: UPD 2: вот тут меня…
Так как посты два раза никто не читает, то напишу отдельно: UPD 2: вот тут меня натолкнули на идею, что это для аудио-моделей, которые...
- #328123-го января один из самых известных скалолазов Alex Honnold предпримет попытку…
23-го января один из самых известных скалолазов Alex Honnold предпримет попытку забраться на некогда самое высокое здание в мире, Taipei 101. Без страховки.
- #3279Как мы знаем, Jony Ive работает с OpenAI над несколькими новыми девайсами,…
Как мы знаем, Jony Ive работает с OpenAI над несколькими новыми девайсами, заточенными в первую очередь под интеграцию с ИИ.