Совсем недавно я рассуждал про мощности, необходимые для тренировки Agent 0 и Agent 1 из работы AI-2027, и пришёл к выводу, что немного отстаём от обозначенных таймлайнов (не успели достроить и запустить датацентры). С выходом GPT-5.1-Codex-Max METR провели оценку длительности инженерных задач, которые модель может решать с 50% успеха, и обновили свой график — и по нему видно, что 2025-й идёт к концу, а Agent 0, который должен отрываться, не видно (см. картинку). Кстати, обратите внимание, что при этом замеренное качество отлично ложится на тренд от самих METR. Авторы AI-2027 решили прокомментировать обсуждение в Твиттере — там, как известно, люди не любят читать, только кидать картинки и писать краткие ироничные комменты. Очень большое количество людей, конечно, не заглядывали в расчёты и оценки, и теперь им кажется, что смещение мнения авторов с 2027-го на 2028-й или 2029-й — это полная инвалидация всей работы. В самой же работе, по-моему, яснее некуда было написано, что такое 2027-й и почему авторы выбрали его, и из этого же следовало, что не важно, 2027-й это или 2030-й. Ниже привожу вырезку из комментариев авторов: — Все авторы проекта AI-2027 на момент публикации считали, что вероятность создания AGI к концу 2027 года составляет как минимум >10%, и что наиболее вероятным годом (модой) появления AGI является либо 2027, либо 2028 год. Ведущий автор, оценивал вероятность появления AGI к концу 2027 года примерно в 40% (то есть это даже меньше медианной уверенности). Это объясняется в самом начале. — Почему решили написать сценарий, в котором AGI появляется в 2027 году, если это было модой, а не медианным значением? Дело в том, что когда начинали писать, то 2027 год действительно был медианой главного автора, но к моменту завершения работы и анализа медиана сместилась на 2028 год. У других авторов медианные прогнозы указывали на более поздние сроки, но они согласились, что 2027 год вполне правдоподобен, и поддержали реализацию видения главного автора. — Однако важнее то, что авторы считали (и продолжают считать), что цель сценария заключалась не в том, чтобы показать, «почему AGI появится именно в году X», а в том, чтобы сказать: «мы думаем, что AGI/сверхразум/и т.д. может появиться скоро; но как это будет выглядеть на практике? Как отреагирует правительство? Каковы будут последствия для…» и так далее. Об этом написано на главной странице! — Сейчас медианный прогноз главного автора — это район 2030 года, при этом мода всех авторов приходится на чуть более ранний срок. Вскоре будет опубликован обновленный и улучшенный прогноз сроков, а также пост, объясняющий, как и почему взгляды изменились за последний год. Если вкратце: прогресс оказался несколько медленнее, чем ожидали, и, кроме того, у нас теперь есть новая, улучшенная модель прогноза, которая дает немного другие результаты.
Совсем недавно я рассуждал про мощности, необходимые для тренировки Agent 0 и…
Из этого канала
- #3131https://www.anthropic.com/news/claude-opus-4-5 Claude Opus 4.5 таки смог взять…
https://www.anthropic.com/news/claude-opus-4-5 Claude Opus 4.5 таки смог взять 80% на SWE-bench Verified! Бонусом в модель добавили effort control — прямо как…
- #3132Вместе с моделью добавили 3 новые фичи: — инструмент поиска инструментов —…
Вместе с моделью добавили 3 новые фичи: — инструмент поиска инструментов — программный вызов инструментов — примеры для инструментов Последние два менее…
- #3133Ииии вот из-под крыла Белого Дома выходит анонс THE GENESIS MISSION —…
Ииии вот из-под крыла Белого Дома выходит анонс THE GENESIS MISSION — инициативы, направленной на использование AI в науке.
- #3129В 2024-м Apple объявили о том, что будут делать Private Cloud Compute —…
В 2024-м Apple объявили о том, что будут делать Private Cloud Compute — технологию, позволяющую запускать нейросети на сервере на ваших данных без риска их…
- #3128"CritPt: Probing the Critical Point of AI Reasoning (блог) TLDR: FrontierMath…
"CritPt: Probing the Critical Point of AI Reasoning (блог) TLDR: FrontierMath (что это — читать тут), но для физики, а не математики.