Прочитал тред от Noam Brown, одного из ведущих исследователей OpenAI в части reasoning-моделей. Он делает ещё больший упор на это, не оставляя никакой двусмысленности в том, что пишет. — это general-purpose модель (модель общего назначения), а не что-то, что заточено исключительно на олимпиадную математику. Обычно для подобных результатов, например, в го/доте/покере/итд, исследователи тратят значимое врея на создание ИИ-системы, специализирующегося только на одной узкой области и практически не умеющего делать ничего другого. Но это не модель, специфичная для IMO. Это рассуждающая LLM, включающая новые экспериментальные методы общего назначения. — Noam пишет, что они разработали принципиально новые методы, которые значительно повышают эффективность LLM в решении сложных для проверки задач. Задачи IMO в этом плане выделяются тем, что оценивается не только финальный ответ, но и каждый шаг решения, и то, как все эти шаги связаны, и что пропущено / не сказано (хотя отдельные мелкие шаги всё ещё строго верифицируемы, это ж всё таки математика). — Эта модель думает *долго*. o1 думал секунды. Deep Research — минуты. Эта думает часы. Что важно, она также более эффективна в своём мышлении (не поясняется, что это значит, но предположу, что за то же число токенов рассуждений модель приходит к лучшим результатам, чем «старые» модели — ну, те, что мы только-только получили в руки 😁) — Noam считает, что этот метод имеет большой потенциал для дальнейшего улучшения качества и эффективности, то есть стоит ожидать ещё одного «скачка» в ближайшее время (моя интерпретация; как условно было o1 -> o3) — «Думаю, мы близки к тому, чтобы ИИ начал вносить существенный вклад в научные открытия. Существует большая разница между ИИ, который немного ниже человеческого уровня развития, и ИИ, который немного превосходит его» — «Работая в передовой лаборатории, вы обычно узнаете о передовых возможностях на несколько месяцев раньше остальных. Но этот результат совершенно новый, он основан на недавно разработанных методах. Он стал неожиданностью даже для многих исследователей OpenAI» === «Как бы удивительно это ни звучало, на самом деле это еще важнее, чем заголовок [описывающий достижение золотой медали]»
Прочитал тред от Noam Brown, одного из ведущих исследователей OpenAI в части…
Из этого канала
- #2679Попросил ChatGPT помочь мне угадать, в каких следующих соревнованиях OpenAI…
Попросил ChatGPT помочь мне угадать, в каких следующих соревнованиях OpenAI будут флексить результатами новой модели.
- #2680Таблица с информацией про 44 человека, пришедших в команду Meta's…
Таблица с информацией про 44 человека, пришедших в команду Meta's Superintelligence team.
- #2681Потратил утро на то, чтобы почитать эссе + вайтпейпер mechanize.work . Это…
Потратил утро на то, чтобы почитать эссе + вайтпейпер mechanize.work . Это новая компания Tamay Besiroglu и Ege Erdil, двух бывших сотрудников Epoch.AI, эссе,…
- #2677«Ну так конечно это ожидаемо, ничего удивительного» — скажет хрен с умным…
«Ну так конечно это ожидаемо, ничего удивительного» — скажет хрен с умным видом, поправляя очки.
- #2676Пост плохо состарился — OpenAI объявили, что их внутренняя модель решила 5 из 6…
Пост плохо состарился — OpenAI объявили, что их внутренняя модель решила 5 из 6 задач этого IMO, не справившись лишь с самой сложной, последней задачей.