На ночь глядя под конец года Epoch.AI посчитали оценку GPT-5.2 Pro на… — @seeallochnaya

На ночь глядя под конец года Epoch.AI посчитали оценку GPT-5.2 Pro на FrontierMath Tier 4. Система решила 14 задач из 48. Напомню, что Tier 4 появился полгода назад потому, что авторы поняли, что в первых трёх (выпущенных за полгода до этого 😳) тирах модели уже делают хороший прогресс. Tier 4 включает в себя задачи исследовательского уровня, с которыми сталкиваются профессиональные математики в ходе работы, в частности тех, которые ещё не опубликованы (поэтому модели не могли ни найти, ни обучиться на этом). В Tier 5 видимо включат только те задачи, для которых решений нет 😳 Всего за год модели сделали колоссальный прорыв в математике, и уже находятся на границе meaningful contribution в задачах исследовательского уровня. 🤩 каким же будет 2026-й, компании наперегонки будут заявлять о прорывах тут и там. Уже вижу, как у части сообщетсва будет бомбить, что это хайп, маркетинг и на самом деле ничего такого 🙂

Из этого канала