Qwen 3 TTS Алибаба опубликовала веса модели для синтеза голоса с 0.6B и 1.7B параметров. Веса идут в нескольких вариантах: Voice Design позволяет запромптить желаемый голос, Custom Voice идёт с 9 готовыми голосами для китайского, английского, корейского и японского. Кроме этого опубликовали базовые веса модели, для клонирования голосов и как основу для файнтюна. Модель тренировали на 5 миллионах часов аудио на 10 языках, в том числе русском. Поддержка модели уже есть в vLLM и mlx audio, кроме этого она доступна по API. Веса Демо Блогпост @ai_newz
Qwen 3 TTS Алибаба опубликовала веса модели для синтеза голоса с 0.6B и 1.7B…
Из этого канала
- #4375Waypoint-1: Open-source генератор игровых миров в реальном времени Стартап…
Waypoint-1: Open-source генератор игровых миров в реальном времени Стартап Overworld, основанный выходцами из исследовательской команды Stability AI (не из…
- #4376"Odyssey 2 Pro — интерактивная видеогенерация Помните Odyssey? Ребята начинали…
"Odyssey 2 Pro — интерактивная видеогенерация Помните Odyssey? Ребята начинали с амбиций захватить Голливуд и сделать лучший генератор видео для киноделов.
- #4381Друзья, всем привет. Я лечу в Дубай на пару дней по делам. Интересно много ли у…
Друзья, всем привет. Я лечу в Дубай на пару дней по делам. Интересно много ли у нас в комьюнити людей в Дубае 🇦🇪? Люблю встречаться с людьми из нашего…
- #4371Жиза. Китайцы крутые, я со многими сильными инженерами и сайнтистами китайцами…
Жиза. Китайцы крутые, я со многими сильными инженерами и сайнтистами китайцами работал в мете, в том числе были у меня очень успешные интерны из Китая.
- #4369"RIP App Store / Google Play Manus добавили паблишинг навайбкоденных приложений…
"RIP App Store / Google Play Manus добавили паблишинг навайбкоденных приложений прямо у себя в вебе.