Прочитал тред от Noam Brown, одного из ведущих исследователей OpenAI в части reasoning-моделей. Он делает ещё больший упор на это, не оставляя никакой двусмысленности в том, что пишет. — это general-purpose модель (модель общего назначения), а не что-то, что заточено исключительно на олимпиадную математику. Обычно для подобных результатов, например, в го/доте/покере/итд, исследователи тратят значимое врея на создание ИИ-системы, специализирующегося только на одной узкой области и практически не умеющего делать ничего другого. Но это не модель, специфичная для IMO. Это рассуждающая LLM, включающая новые экспериментальные методы общего назначения. — Noam пишет, что они разработали принципиально новые методы, которые значительно повышают эффективность LLM в решении сложных для проверки задач. Задачи IMO в этом плане выделяются тем, что оценивается не только финальный ответ, но и каждый шаг решения, и то, как все эти шаги связаны, и что пропущено / не сказано (хотя отдельные мелкие шаги всё ещё строго верифицируемы, это ж всё таки математика). — Эта модель думает *долго*. o1 думал секунды. Deep Research — минуты. Эта думает часы. Что важно, она также более эффективна в своём мышлении (не поясняется, что это значит, но предположу, что за то же число токенов рассуждений модель приходит к лучшим результатам, чем «старые» модели — ну, те, что мы только-только получили в руки 😁) — Noam считает, что этот метод имеет большой потенциал для дальнейшего улучшения качества и эффективности, то есть стоит ожидать ещё одного «скачка» в ближайшее время (моя интерпретация; как условно было o1 -> o3) — «Думаю, мы близки к тому, чтобы ИИ начал вносить существенный вклад в научные открытия. Существует большая разница между ИИ, который немного ниже человеческого уровня развития, и ИИ, который немного превосходит его» — «Работая в передовой лаборатории, вы обычно узнаете о передовых возможностях на несколько месяцев раньше остальных. Но этот результат совершенно новый, он основан на недавно разработанных методах. Он стал неожиданностью даже для многих исследователей OpenAI» === «Как бы удивительно это ни звучало, на самом деле это еще важнее, чем заголовок [описывающий достижение золотой медали]»