"Seed-Coder 8B Лучшая в своей весовой категории LLM для кодинга, прямо от китайцев из Bytedance. Бьёт даже недавний Qwen 3 на коде, но даже не пытается конкурировать на других задачах. Кроме обычной инстракт модели натренировали и ризонер. При этом всём модель натренировали всего на 6 триллионах токенов, что крайне мало — датасеты лучших открытых моделей сейчас уже часто больше 30 триллионов токенов. Ключевой элемент тренировки — ""model-centric"" пайплайн. Специальные LLM-фильтры оценивают код (читаемость, модульность и другие аспекты) из GitHub и веб-источников, отсеивая низкокачественные примеры. Таким образом они фильтруют данных примерно на ~2.3 триллиона токенов. Затем модель тренируют в течении 6 триллионах токенов, что даёт небольшую несостыковку. Скорее всего какие-то данные повторялись в датасете несколько раз, но авторы пейпера не говорят об этом напрямую. Инстракт-версию тренируют через SFT (на синтетике, которую тоже LLM нагенерили и отфильтровали) и DPO. Ризонинг-модель дрессируют через LongCoT RL, чтобы она лучше решала сложные задачки. Итог: Seed-Coder рвёт опенсорс-аналоги своего размера на бенчмарках (генерация, автодополнение, ризонинг и т.д.), а местами и более жирные модели. Веса: Reasoner/Instruct Техрепорт @ai_newz"
"Seed-Coder 8B Лучшая в своей весовой категории LLM для кодинга, прямо от…
Из этого канала
- #3901"Нейродайджест за неделю (#68) С майскими! LLM - Баф Gemini 2.5 Pro — быстрее,…
"Нейродайджест за неделю (#68) С майскими! LLM - Баф Gemini 2.5 Pro — быстрее, лучше, сильнее! Топ вебдеф арены.
- #3902ChatGPT обновили функцию Deep Research – теперь можно скачивать отчеты в…
ChatGPT обновили функцию Deep Research – теперь можно скачивать отчеты в формате красивого pdf
- #3903Тех-репорт Qwen3 Вышел тех-репорт по одной из сильнейших LLM моделей в…
Тех-репорт Qwen3 Вышел тех-репорт по одной из сильнейших LLM моделей в OpenSource на сегодня - Qwen 3 (про анонс подробнее я писал тут).
- #3899Почему цена за токен — это ещё не всё Artificial Analysis недавно начали…
Почему цена за токен — это ещё не всё Artificial Analysis недавно начали замерять цену за прогон их набора тестов, дошли они и до новых моделей Google.
- #3897"Сколько стоит минута AI-фильма и как победить в крупнейшем конкурсе этих…
"Сколько стоит минута AI-фильма и как победить в крупнейшем конкурсе этих фильмов? Этой зимой проходил, пожалуй, один из самых больших и влиятельных конкурсов…