Вышел DeepCoder 14B Preview Новый ризонер специально для кода, лидирующий в 14B весовой категории и догоняющий o3-mini и o1, когда они обе на low настройках. Неприятный звоночек — модель не сравнивают с QwQ 32B, основным конкурентом этой модели, а с моделями OpenAI сравнивают только на low настройках. Причём непонятно почему — результаты достойные, даже o3-mini (low) обойти это непросто. За основу взят DeepSeek R1 Distill 14B, поверх которого запустили RL на 24к задач для кодинга. Это сильно бампануло качество кодинга по сравнению с бейзлайном, при этом случайно улучшив результаты на математике. Сделали эту модель в колабе с Together AI, это один из клауд провайдеров заточенных специально на ИИ. Я уже писал пару лет назад об их датасете RedPajama, воспроизводящем датасет оригинальной Llama. А вот самая лучшая часть — авторы опубликовали не только веса, но и код с датасетом. Всё это можно прямо сейчас скачать с 🤗 и гитхаба. __И мы все ближе к маленьким и умелым моделькам, которые можно запускать локально (а 14B можно запускать и на обычном железе) и которые могут заменить проприетарные модели. На этот раз в кодинге. Не устану повторять, что опен сорс – это круто!__ Веса Код Датасет @ai_newz
Вышел DeepCoder 14B Preview Новый ризонер специально для кода, лидирующий в 14B…
Из этого канала
- #3814Почему опенсорс – это круто? Наткнулся на такой тред в X – некоторые люди не…
Почему опенсорс – это круто? Наткнулся на такой тред в X – некоторые люди не понимают, зачем что-то опенсорсить (первый срин).
- #3817TPU v7 — Ironwood Google показали новое поколение TPU, на одном уровне с…
TPU v7 — Ironwood Google показали новое поколение TPU, на одном уровне с Blackwell. В новом поколении 4.6 Dense петафлопса на чип — чуть больше чем в B200.
- #3818HiDream-I1 (17B) - новая txt2img SOTA Пора бы уже привыкнуть, что нонейм…
HiDream-I1 (17B) - новая txt2img SOTA Пора бы уже привыкнуть, что нонейм команда из Китая нагибает западные СОТА.
- #3812Nvidia выпустила своего большого ризонера В основе — Llama 3.1 405B, которую…
Nvidia выпустила своего большого ризонера В основе — Llama 3.1 405B, которую запрунили до 253B параметров.
- #3809Нейродайджест за неделю (#63) LLM - Ждём Qwen 3 — будут модельки всех размеров…
Нейродайджест за неделю (#63) LLM - Ждём Qwen 3 — будут модельки всех размеров от мобильных до гигантских.