Gemini 3 Deep Think 84.6% на ARC-AGI-2, 3455 Elo на Codeforces. Большую ставку делают именно на реальный ресерч и применение в физике и химии — заявлен уровень золота на олимпиадах по физике и химии 2025 года, а в бенчмарке по теоретической физике (CMT) модель выбивает 50.5%. Судя по графикам это новая SOTA. Уже доступно подписчикам Ultra и в API по вейтлисту. @ai_newz
Gemini 3 Deep Think 84.6% на ARC-AGI-2, 3455 Elo на Codeforces. Большую ставку…
Из этого канала
- #4420Релизнули веса MiniMax M2.5 Как и прошлые версии, это 229B модель с 10B…
Релизнули веса MiniMax M2.5 Как и прошлые версии, это 229B модель с 10B активных параметров. Локальные агентные модели всё ближе.
- #4421"Seedance 2.0 — как пощупать новую SOTA-видеогенерацию Получаем доступ к…
"Seedance 2.0 — как пощупать новую SOTA-видеогенерацию Получаем доступ к новенькому Seedance 2.0 раньше всех.
- #4422Нейродайджест за неделю (#107) LLM - GLM 5 — новая лучшая открытая модель. При…
Нейродайджест за неделю (#107) LLM - GLM 5 — новая лучшая открытая модель. При 744B параметров тягается с лидерами, хотя и весьма прожорлива в плане ресурсов.
- #4417Лучшие модели для кодинга сейчас: - Opus 4.6 (в Claude Code) - GPT‑5.3‑Codex (в…
Лучшие модели для кодинга сейчас: - Opus 4.6 (в Claude Code) - GPT‑5.3‑Codex (в Codex cli) - GLM-5 (эту я ещё не пробовал, но народ пишет, что она даже лучше…
- #4416"А вот и официальный анонс MiniMax M2.5 По опубликованным бенчам модель…
"А вот и официальный анонс MiniMax M2.5 По опубликованным бенчам модель примерно на уровне GLM 5 (где-то обгоняет, где-то отстаёт), но заметно дешевле —…