GLM-5 – новая SOTA в опенсорсе и серьезная заявка от китайцев Z.ai выпустили свежую опенсорсную модель, которая тягается с Opus 4.5, Gemini 3 Pro и GPT-5.2. Предназначена она специально для кодинга, креативного письма, математики и всяких агентных задач. Пишут, что модель также очень хороша на длинных контекстах (но в релизе указано 200K токенов, так что смотря, что считать длинным). В целом метрики очень и очень ничего. Отличный скор на HLE и SWE-bench, особенно учитывая открытые веса. Кстати, еще одна интересная деталь: GLM-5 обучена полностью на чипах Huawei Ascend с фреймворком MindSpore, без зависимости от американского оборудования. По крайней мере, так пишут в релизе. Если правда, то это довольно серьезный прорыв для Китая во всех смыслах. Под капотом: – MoE 745В (44В активных). Это в два раза больше предшественницы GLM-4.5, кстати. – 78 слоев, первые три плотные, остальные с DeepSeek Sparse Attention (DSA): как раз для эффективной работы с длинными последовательностями – Реализован Multi-Token Prediction (MTP): модель предсказывает сразу несколько токенов за один проход форварда. В итоге скорость получается около 50+ токенов/сек, что почти в два раза быстрее предыдущего поколения. Веса (MIT License) Чат Также модель доуступна в WaveSpeed API ($0.90/м input и $2.88/м output)
GLM-5 – новая SOTA в опенсорсе и серьезная заявка от китайцев Z.ai выпустили…
Из этого канала
- #8727Google DeepMind сделали, возможно, самого мощного ИИ-математика на сегодняшний…
Google DeepMind сделали, возможно, самого мощного ИИ-математика на сегодняшний день Они представили Aletheia – агента, который набрал 91.9% на IMO-ProofBench…
- #8729ARC-AGI-2 решился спустя всего год после публикации Google выпустили…
ARC-AGI-2 решился спустя всего год после публикации Google выпустили специальный обновленный ризонинг мод Gemini 3 Deep Think.
- #8733Создатель ARC-AGI Франсуа Шолле заявил, что ARC-AGI-4 уже находится в…
Создатель ARC-AGI Франсуа Шолле заявил, что ARC-AGI-4 уже находится в разработке, а всего версий бенчмарка будет около 7 ARC-AGI-3 – выходит в паблик в марте,…
- #8725"Сегодня у Маска плохой день: ключевые инженеры и рисерчеры массово покидают…
"Сегодня у Маска плохой день: ключевые инженеры и рисерчеры массово покидают xAI и уходят делать свой стартап За последние сутки об уходе из компании объявили…
- #8723Знаменитый Джон Кармак предложил использовать оптоволокно вместо DRAM Идея не…
Знаменитый Джон Кармак предложил использовать оптоволокно вместо DRAM Идея не лишена смысла.