Devstral 24B — лучшая открытая агентная модель для кодинга Mistral AI и All Hands AI представили Devstral — специализированную LLM для реальных задач в кодинге, с 46.8% на SWE-Bench Verified, что делает её на 6% выше лучших открытых моделей. Это всё несмотря на малый размер — модель влезает в 3090 или Mac с 32 гигами оперативки. Модель работает через агентные фреймворки (одна из компаний всё же авторы OpenHands) для взаимодействия с кодбазами. Вероятно её хорошо научили пользоваться скафолдингом, из-за чего такие хорошие результаты, даже без ризонинга. Модель доступна по лицензии Apache 2.0, то есть её спокойно можно использовать в коммерческих целях. Через пару недель обещают модели побольше, но вряд ли настолько же открытые. Веса Блогпост @ai_newz
Devstral 24B — лучшая открытая агентная модель для кодинга Mistral AI и All…
Из этого канала
- #3925Anthropic только что релизнули Claude 4 Sonnet и Opus Модели концентрируются на…
Anthropic только что релизнули Claude 4 Sonnet и Opus Модели концентрируются на кодинге и агентах — там они SOTA, в остальных бенчах всё более спорно.
- #3927"Parallel Scaling Law Обычно LLM масштабируют либо через параметры (Dense,…
"Parallel Scaling Law Обычно LLM масштабируют либо через параметры (Dense, MoE), либо через время инференса (CoT).
- #3928Нейродайджест за неделю (#70) Юбилейный и неделя Google Google I/O - Дайджест…
Нейродайджест за неделю (#70) Юбилейный и неделя Google Google I/O - Дайджест по презентации — собрал все фишки с пояснениями, что как работает.
- #3922Veo 3– это разъб. Кажется, мы действительно не так далее от кастомных развязок…
Veo 3– это разъб. Кажется, мы действительно не так далее от кастомных развязок в фильма и сериалах. Индустрия развлечений никогда не будет прежней.
- #3920"Что показали на Google I/O? Только что завершилась презентация Google, и это,…
"Что показали на Google I/O? Только что завершилась презентация Google, и это, похоже, крупнейшая презентация 2025-го по количеству и качеству новых фишек и…