Самый крутой скачок GPT-5.2 произошел, пожалуй, на ARC-AGI На ARC-AGI 1 модель достала 86.2% (GPT-5.1 берет 72.8%, Gemini 3 Pro – 75). Это серьезный рост. При этом GPT-5.2 Pro с повышенным уровнем ризонинга X-High скорит уже 90.5% при стоимости $11.64/задачу. Всего год назад сотой считалась нерелизнутая o3-High с результатом 88% и $4.5k/задачу. Это означает, что за год эффективность выросла в 390 раз. На ARC-AGI 2 все еще интереснее. Там скачок произошел с 17.6 до 52.9%! Самый близкий по скору конкурент – Claude Opus 4.5 – выбивает всего 37.6%. Просто напоминаем, что между релизами GPT-5.1 и 5.2 прошел месяц 😐 GPT 5.2 Pro X-High точно скорит еще больше, но организаторы бенчмарка пишут, что пока не смогли достоверно проверить ее результаты из-за API timeouts. Средний уровень человека на ARC-AGI 2 – около 60%. Интересно, побьет ли.
Самый крутой скачок GPT-5.2 произошел, пожалуй, на ARC-AGI На ARC-AGI 1 модель…
Из этого канала
- #8489MWS Cloud запустила сервис по установке серверов с GPU в периметре предприятий…
MWS Cloud запустила сервис по установке серверов с GPU в периметре предприятий Компания предлагает готовые серверы с графическими ускорителями прямо у вас на…
- #8490Сегодня OpenAI исполняется ровно 10 лет О создании компании было объявлено 12…
Сегодня OpenAI исполняется ровно 10 лет О создании компании было объявлено 12 декабря 2015 года.
- #8491Google обновили агента Gemini Deep Research: теперь он работает на базе Gemini…
Google обновили агента Gemini Deep Research: теперь он работает на базе Gemini 3 и выбивает 46.4% на HLE Систему дотюнивали с помощью многоступенчатого RL,…
- #8479⚡️ Вышла GPT-5.2 – Модель заметно прокачали в кодинге, математике и работе на…
⚡️ Вышла GPT-5.2 – Модель заметно прокачали в кодинге, математике и работе на длинных контекстах и с изображениями.
- #8478Сэм Альтман, Дженсен Хуанг и другие ИИ-лидеры коллективно стали «Человеком…
Сэм Альтман, Дженсен Хуанг и другие ИИ-лидеры коллективно стали «Человеком года» по версии Time В этом году победителем номинации стал не один человек, а целая…