Vikhr Borealis - первая русскоязычная открытая audio llm Мы долго и не очень успешно развивали свой tts - Salt, от него исторически осталось довольно много данных и наработок, мы решили - чо бы не сварить asr + llm как модно? Ну и сварили. Архитектурно - whisper + qwen, учили на 7к часов аудио только адаптер+llm, сейчас работает только в ASR режиме, позже возможно довезем инструктивный режим. Так же выйдет бенчмарк для русского asr, он пока в доработке. Блог так же выйдет, там будут небольшие аблейшены по данным Модель в данный момент бьет whisperы на русском и на части бенчей лучше чем gigam. Модель Сolab поиграться
Vikhr Borealis - первая русскоязычная открытая audio llm Мы долго и не очень…
Из этого канала
- #4165Вертикальные видео в VEO 3 Ну всё, RIP ленты соцсетей. Теперь они будут ещё…
Вертикальные видео в VEO 3 Ну всё, RIP ленты соцсетей. Теперь они будут ещё больше захламлены генеративным слопом, ведь VEO 3 наконец-то научилась генерить…
- #4166Нейродайджест за неделю (#86) LLM - ASML инвестирует $1.5 миллиарда в Mistral…
Нейродайджест за неделю (#86) LLM - ASML инвестирует $1.5 миллиарда в Mistral — Европа встаёт с колен.
- #4168Nvidia Rubin CPX — чипы для ИИ всё более специализируются Инференс современных…
Nvidia Rubin CPX — чипы для ИИ всё более специализируются Инференс современных LLM состоит из двух стадий: prefill и decoding, которые крайне отличаются по…
- #4163Весной 2025 года на рынке массово стали появляться агентные инструменты для…
Весной 2025 года на рынке массово стали появляться агентные инструменты для разработки — Claude Code, Codex и другие тулы выкатывали один за другим.
- #4161Qwen 3 Next — очень эффективный 80B-A3B модельки, есть как Instruct так и…
Qwen 3 Next — очень эффективный 80B-A3B модельки, есть как Instruct так и Reasoning вариант.