Magistral — Mistral наконец-то сделали ризонера И сразу же стало понятно почему они так медлили — это катастрофа. Magistral Medium не может обогнать даже январскую DeepSeek R1 в одинаковых условиях, что уже говорить про R1-0528, которую они не могут догнать даже с maj@64. Доступна модель лишь в API, при цене в $2/$5 за миллион токенов, то есть она дороже o4-mini ($1.1/$4.4) и почти на уровне новых цен на o3 ($2/$8), а это всё модели на голову или две лучше. Выпустили они и открытую модель — Magistral Small, 24B модель, которая отстаёт на большинстве бенчей даже от Qwen 3 8B (8B просто не замеряли на Aider, так что обогняет ли она Magistral и там непонятно). А ведь существуют и Qwen 3 побольше. Из хорошего — они опубликовали пейпер о тренировке модели, где довольно детально описали процесс тренировки. А благодаря партнёрству с Cerebras, в LeChat Magistral работает крайне быстро — больше 1000 токенов в секунду (правда бесплатным юзерам дают лишь 3 таких запроса в день). UPD: Magistral Medium тренировали исключительно при помощи RL, без SFT, так что сравнивать её стоит скорее с R1-Zero. Может когда-то они докинут SFT и модель станет более адекватно работать. Пейпер Блогпост Веса Magistral Small Веса Qwen 3 8B @ai_newz
Magistral — Mistral наконец-то сделали ризонера И сразу же стало понятно почему…
Из этого канала
- #3948OpenAI релизнули o3 pro Доступ к модели уже дают Pro подписчикам и в API.…
OpenAI релизнули o3 pro Доступ к модели уже дают Pro подписчикам и в API. Модель заметно дешевле o1 pro — $20/$80 за миллион токенов, по сравнению с $150/$600…
- #3951Авито показали технологическую внутрянку компании На фестивале Data Fest Авито…
Авито показали технологическую внутрянку компании На фестивале Data Fest Авито показали, как работают языковые и визуальные модели, обучаются агенты поддержки,…
- #3952OpenAI ещё раз удвоили лимиты на o3 для Plus подписчиков Как оказалось обычным…
OpenAI ещё раз удвоили лимиты на o3 для Plus подписчиков Как оказалось обычным подписчикам вчера тоже завезли подарочек — теперь в неделю дают 200 сообщений,…
- #3946Тем временем прошла WWDC от Apple Самая интересная ИИ фича с WWDC — Foundation…
Тем временем прошла WWDC от Apple Самая интересная ИИ фича с WWDC — Foundation Models Framework Apple теперь дают доступ к LLM в Apple Intelligence сторонним…
- #3945CVPR 2025 Коротко, что это за конференция: CVPR — самая крупная и самая…
CVPR 2025 Коротко, что это за конференция: CVPR — самая крупная и самая престижная конференция по компьютерному зрению и AI.