Тут вышла свежая статья про AlphaEvolve с Теренсом Тао в соавторстве. В отличие от старой статьи разбирают большую кучу математических проблем. Mathematical exploration and discovery at scale __Bogdan Georgiev, Javier Gómez-Serrano, Terence Tao, and Adam Zsolt Wagner__ Статья: https://arxiv.org/abs/2511.02864 Ревью: https://arxiviq.substack.com/p/mathematical-exploration-and-discovery Код: https://github.com/google-deepmind/alphaevolve_repository_of_problems Что сделали? В этой 80-страничной статье авторы проводят глубокую и всестороннюю валидацию AlphaEvolve — ИИ-системы, которая использует большую языковую модель (LLM) для управления эволюционным поиском новых математических конструкций (наш разбор AlphaEvolve тут: https://t.me/gonzo_ML/3624). Существенно расширяя первоначальную публикацию о системе, авторы протестировали AlphaEvolve на большом наборе из 67 сложных задач из анализа, комбинаторики и геометрии. Система представляет собой значительный скачок по сравнению с предшественником, FunSearch, поскольку она позволяет эволюционировать целым кодовым базам, а не отдельным функциям. Авторы также подробно описывают новые режимы работы, такие как «обобщитель» (generalizer), который выводит универсальные формулы из частных примеров, и демонстрируют полный ИИ-пайплайн, объединяющий AlphaEvolve (для поиска закономерностей), Deep Think (для символических доказательств) и AlphaProof (для формальной верификации). Система автономно переоткрыла известные решения и во многих случаях нашла новые SOTA-конструкции и улучшенные численные границы — от увеличения числа поцелуев в 11-мерном пространстве до нахождения более плотной упаковки для 11 кубов. Почему это важно? Эта работа задаёт новую парадигму «конструктивной математики в больших масштабах», демонстрируя мощную и эффективную методологию для сотрудничества человека и ИИ. Статья, написанная командой, в которую входит лауреат Филдсовской премии Теренс Тао, показывает, как ИИ может систематически исследовать огромные пространства поиска для нахождения конкретных решений, дополняющих человеческую интуицию, — часто за часы, а не месяцы. В отличие от ИИ-систем, нацеленных на доказательство существующих теорем (например, для золотых медалей IMO), AlphaEvolve преуспевает в __создании__ новых объектов и гипотез, которые и двигают математический прогресс. Она предлагает концепцию будущего, в котором ИИ не только проверяет человеческие знания, но и активно участвует в их создании, переходя от эмпирических наблюдений к формально верифицированным результатам. Подробрее: https://t.me/gonzo_ML_podcasts/1275 Среди наблюдений по ходу дела, вот это прикольное: __Более способные LLM имеют тенденцию производить более высококачественные решения. Но что, возможно, ещё удивительнее, они обнаружили, что использование исключительно самой мощной LLM не всегда было лучшей стратегией. Для некоторых задач чередование вызовов более дешёвых и менее способных моделей добавляло полезную вариативность и «наивную креативность» в эволюционный процесс, что приводило к более экономически эффективному поиску.__ Также Гугл недавно анонсировал AI for Math Initiative: https://blog.google/technology/google-deepmind/ai-for-math/
Тут вышла свежая статья про AlphaEvolve с Теренсом Тао в соавторстве. В отличие…
Из этого канала
- #3066Решаем действительно важные проблемы «от увеличения числа поцелуев в 11-мерном…
Решаем действительно важные проблемы «от увеличения числа поцелуев в 11-мерном пространстве до нахождения более плотной упаковки для 11 кубов» 😀 Если хотите…
- #3067Ключевые задачи второго тестевого полёта тяжёлой ракеты New Glenn. Сегодня…
Ключевые задачи второго тестевого полёта тяжёлой ракеты New Glenn. Сегодня будет тяжёлый, во всех смыслах, день для Blue Origin — второй и последний тестовый…
- #3069В январе мы впервые услышали, что OpenAI ставит на этот год целью достижение…
В январе мы впервые услышали, что OpenAI ставит на этот год целью достижение миллиарда пользователей ChatGPT в сутки.
- #3064"Один из по-настоящему свежих и новых взглядов на влияние AI на экономику я…
"Один из по-настоящему свежих и новых взглядов на влияние AI на экономику я услышал в интервью Andrej Karpathy 3 недели назад (кстати, найти источник мне…
- #3062Кроме этого, CFO OpenAI на одной из встреч сказала что-то про государство, Sama…
Кроме этого, CFO OpenAI на одной из встреч сказала что-то про государство, Sama в другой речи тоже упомянул GOVERNMENT, и вот люди уже говорят про то, что…