Вышла GLM 5 У нас новая лучшая открытая модель, по крайней мере по бенчам. С проприетарными тягается неплохо, но с Opus 4.6 и GPT 5.3 Codex почему-то не сравнивают, хотя за неделю после релиза тесты можно было прогнать. Веса доступны по лицензии MIT. Архитектура похожа на DeepSeek V3.2 — тоже используют DSA и multi-token prediction. Модель в 2 раза больше предыдущей модели компании — 744 миллиарда параметров (против 355), из которых 40B — активных. А вот датасет почти не вырос — 28.5 триллионов токенов, против 23 у GLM 4.5. Основной упор всё-таки идёт на RL, но про него-то как раз не говорят (надеюсь в техрепорте будет больше инфы). Ложка дёгтя — модель использует заметно больше ресурсов чем основной конкурент, Kimi K2.5. У GLM 5 на 25% больше активных параметров и используется в 2+ раза больше памяти на веса из-за использования bf16, что делает модель ещё и медленнее. В результате модель на 30% дороже, судя по тестам Artificial Analysis. Zhipu жалуются на отсутствие компьюта, похоже из-за этого GLM 5 работает на железе чуть ли не всех китайских производителей чипов для ИИ — Huawei Ascend, Moore Threads, Cambricon, Kunlun Chip, MetaX, Enflame и Hygon (я о половине даже не слышал). Из-за проблем с компьютом, доступ по подписке открыли пока только подписчикам уровня Max, но обещают докинуть остальным в ближайшее время. __Там ещё MiniMax M2.5 втихую ____дропнулся____, но пока нет анонса и весов__ Веса Блогпост @ai_newz
Вышла GLM 5 У нас новая лучшая открытая модель, по крайней мере по бенчам. С…
Из этого канала
- #4416"А вот и официальный анонс MiniMax M2.5 По опубликованным бенчам модель…
"А вот и официальный анонс MiniMax M2.5 По опубликованным бенчам модель примерно на уровне GLM 5 (где-то обгоняет, где-то отстаёт), но заметно дешевле —…
- #4417Лучшие модели для кодинга сейчас: - Opus 4.6 (в Claude Code) - GPT‑5.3‑Codex (в…
Лучшие модели для кодинга сейчас: - Opus 4.6 (в Claude Code) - GPT‑5.3‑Codex (в Codex cli) - GLM-5 (эту я ещё не пробовал, но народ пишет, что она даже лучше…
- #4418Gemini 3 Deep Think 84.6% на ARC-AGI-2, 3455 Elo на Codeforces. Большую ставку…
Gemini 3 Deep Think 84.6% на ARC-AGI-2, 3455 Elo на Codeforces. Большую ставку делают именно на реальный ресерч и применение в физике и химии — заявлен уровень…
- #4414Видео модель Seedance 2.0, которая вышла на днях – это прям сильный скачок…
Видео модель Seedance 2.0, которая вышла на днях – это прям сильный скачок качества от предыдущей версии.
- #4411🔥Курс по Deep Learning (Fall 2024) от MIT доступен онлайн! Один из лекторов -…
🔥Курс по Deep Learning (Fall 2024) от MIT доступен онлайн! Один из лекторов - Phillip Isola, чень крутой ресерчер в Computer Vision.