Mistral выкатили Small 4 И всё грустно. На опубликованных бенчах модель…

17 мар. 2026 г.30 072 views101 forwardsОткрыть в Telegram →

Mistral выкатили Small 4 И всё грустно. На опубликованных бенчах модель проигрывает сентябрьскому Qwen 3 Next, у которого в полтора раза меньше параметров в целом и в два раза меньше активных. Моделька мультимодальная с 256к токенов контекста. Архитектура — та же вариация на тему DeepSeek V3 что использовалась в Large 3. Доступна по Apache 2.0, базовую модель не выложили, но зато сделали голову для спекулятивного декодинга. Веса: FP8/NVFP4 @ai_newz

Источник

https://t.me/ai_newz/4476

Канал эйай ньюз · опубликовано 17 мар. 2026 г.

Из этого канала