А вот и бенчи DeepSeek R1 0528 Прокачали знатно — модель теперь уверенно обходит Qwen 3 235B, но отстаёт от Gemini 2.5 Pro и o3, хоть и не так сильно. Прирост во многом объясняется выросшим количеством размышлений — в среднем 23к токенов, против 12к токенов у прошлой версии. Кроме прокачки по бенчам, модель теперь меньше галлюцинирует и лучше делает фронтенд (но до клода очевидно не дотягивает). Кроме релиза большой версии, цепочки рассуждений из новой DeepSeek R1 дистиллировали в Qwen 3 8B. После такого тюна модель стала заметно лучше на математических бенчах. Уже можно скачать с 🤗. Большая модель 8B дистил @ai_newz
А вот и бенчи DeepSeek R1 0528 Прокачали знатно — модель теперь уверенно…
Из этого канала
- #3935Сегодня GPT-3 исполнилось пять лет Хороший повод вспомнить насколько всё сильно…
Сегодня GPT-3 исполнилось пять лет Хороший повод вспомнить насколько всё сильно изменилось за эти пять лет.
- #3936Помните как Claude 4 уведомлял власти если видел серьёзное правонарушение?…
Помните как Claude 4 уведомлял власти если видел серьёзное правонарушение? После выхода system card многие возмутились — ведь LLM всё ещё часто галлюцинируют и…
- #3937"Нейродайджест за неделю (#71) LLM - DeepSeek R1 обновили — теперь обходит Qwen…
"Нейродайджест за неделю (#71) LLM - DeepSeek R1 обновили — теперь обходит Qwen 3 235B, но всё ещё за Gemini 2.5 Pro и o3.
- #3933DeepSeek R1 обновили По традиции 🐳 выложили веса без деталей, они появятся…
DeepSeek R1 обновили По традиции 🐳 выложили веса без деталей, они появятся позже. Модель уже доступна в чате, API пока не обновили.
- #3932Сейчас в универах большой спрос на экспертов в машинном обучении, ведь ИИ…
Сейчас в универах большой спрос на экспертов в машинном обучении, ведь ИИ развивается как сумасшедший.