Gemini 3 Deep Think 84.6% на ARC-AGI-2, 3455 Elo на Codeforces. Большую ставку…

13 февр. 2026 г.31 954 views250 forwardsОткрыть в Telegram →

Gemini 3 Deep Think 84.6% на ARC-AGI-2, 3455 Elo на Codeforces. Большую ставку делают именно на реальный ресерч и применение в физике и химии — заявлен уровень золота на олимпиадах по физике и химии 2025 года, а в бенчмарке по теоретической физике (CMT) модель выбивает 50.5%. Судя по графикам это новая SOTA. Уже доступно подписчикам Ultra и в API по вейтлисту. @ai_newz

Источник

https://t.me/ai_newz/4418

Канал эйай ньюз · опубликовано 13 февр. 2026 г.

Из этого канала

#4420Релизнули веса MiniMax M2.5 Как и прошлые версии, это 229B модель с 10B…
Релизнули веса MiniMax M2.5 Как и прошлые версии, это 229B модель с 10B активных параметров. Локальные агентные модели всё ближе.
#4421"Seedance 2.0 — как пощупать новую SOTA-видеогенерацию Получаем доступ к…
"Seedance 2.0 — как пощупать новую SOTA-видеогенерацию Получаем доступ к новенькому Seedance 2.0 раньше всех.
#4422Нейродайджест за неделю (#107) LLM - GLM 5 — новая лучшая открытая модель. При…
Нейродайджест за неделю (#107) LLM - GLM 5 — новая лучшая открытая модель. При 744B параметров тягается с лидерами, хотя и весьма прожорлива в плане ресурсов.
#4417Лучшие модели для кодинга сейчас: - Opus 4.6 (в Claude Code) - GPT‑5.3‑Codex (в…
Лучшие модели для кодинга сейчас: - Opus 4.6 (в Claude Code) - GPT‑5.3‑Codex (в Codex cli) - GLM-5 (эту я ещё не пробовал, но народ пишет, что она даже лучше…
#4416"А вот и официальный анонс MiniMax M2.5 По опубликованным бенчам модель…
"А вот и официальный анонс MiniMax M2.5 По опубликованным бенчам модель примерно на уровне GLM 5 (где-то обгоняет, где-то отстаёт), но заметно дешевле —…