Не забыли DeepSeek и про простых смертных - компания выпустила целую линейку дистиллированых из R1 моделей. Даже 1.5B моделька показывает себя лучше Sonnet и оригинальной 4o на математических бенчмарках, 14B уверенно обходит QwQ, а 32B - o1-mini (правда отстаёт на Codeforces). Вместо дистилляции пробовали учить напрямую через RL на маленькой модельке, но результаты были сильно хуже. С дистилляцией модель может напрямую учиться у большей модели размышлять, а не самой искать эффективные способы размышления. __Интеллект для всех, даром, и пусть никто не уйдёт обиженный!__ Qwen 1.5B Qwen 7B Llama 8B Qwen 14B Qwen 32B Llama 70B @ai_newz
Не забыли DeepSeek и про простых смертных - компания выпустила целую линейку…
Из этого канала
- #3628Забавная возможность R1 - генерировать видосы объясняющие математические…
Забавная возможность R1 - генерировать видосы объясняющие математические концепты по одному запросу. Алмазный век с его букварём все ближе.
- #3629"😮Трамп анонсировал проект Stargate по построению AI инфраструктуры в США на…
"😮Трамп анонсировал проект Stargate по построению AI инфраструктуры в США на $500 млрд Инвестиции в размере $500B – это очень много денег, и составляет 1.7%…
- #3630"Google продолжает эксперименты с reasoner моделями. Компания обновила свою…
"Google продолжает эксперименты с reasoner моделями. Компания обновила свою Gemini Flash Thinking (доступна бесплатно в AI Studio) - она теперь умнее, имеет…
- #3626🔥DeepSeek R1 - уровень o1 бесплатно Бенчи говорят сами за себя. Модель уже…
🔥DeepSeek R1 - уровень o1 бесплатно Бенчи говорят сами за себя. Модель уже бесплатно доступна в чате (50 сообщений в день), веса выложены на HuggingFace.
- #3624DeepSeek выпустили веса R1, своей reasoner модели Как обычно, компания сначала…
DeepSeek выпустили веса R1, своей reasoner модели Как обычно, компания сначала релизит веса, и лишь потом техрепорты и бенчмарки.