Команда Три Дао снова применяет чёрную магию оптимизации, на этот раз для ускорения тренировки MoE. SonicMoE почти в два раза быстрее лучших открытых кернелов для MoE, при этом используя почти в два раза меньше памяти для хранения активаций. На практике это повышает эффективность тренировки в полтора раза — 64 H100 с SonicMoE тренируют 7B MoE модель с такой же скоростью как 96 H100 с предыдущей лучшей имплементацией. Пейпер Код @ai_newz
Команда Три Дао снова применяет чёрную магию оптимизации, на этот раз для…
Из этого канала
- #4342Предлагаю ребрендинг – не АИ слоп, а эко-текст и не бездушная АИ-картинка - а…
Предлагаю ребрендинг – не АИ слоп, а эко-текст и не бездушная АИ-картинка - а эко-графика Потому что текст из LLM и генеративные АИ-картинки оставляют намного…
- #4344Нейродайджест за неделю (#99) LLM - Вышла Gemini 3 Flash — Выносит 2.5 Pro, на…
Нейродайджест за неделю (#99) LLM - Вышла Gemini 3 Flash — Выносит 2.5 Pro, на паре бенчей обгоняет даже Gemini 3 Pro, будучи значительно дешевле.
- #4345Яндекс разработал ИИ-инструмент для автоматического анализа видеозаписей с…
Яндекс разработал ИИ-инструмент для автоматического анализа видеозаписей с лабораторными мышами.
- #4339Kandinsky 5.0 Video на text-to-video арене На арене появились результаты…
Kandinsky 5.0 Video на text-to-video арене На арене появились результаты моделей Kandinsky 5.0 Video Lite и Pro. Pro-версия — ТОП-1 открытая модель в мире.
- #4338mini-SGLang — оптимизированный минималистичный инференс движок Кодбаза способна…
mini-SGLang — оптимизированный минималистичный инференс движок Кодбаза способна на полноценный инференс Qwen 3 (Dense) и Llama 3 на уровне производительности…