Qwen 3 TTS Алибаба опубликовала веса модели для синтеза голоса с 0.6B и 1.7B…

23 янв. 2026 г.33 372 views647 forwardsОткрыть в Telegram →

Qwen 3 TTS Алибаба опубликовала веса модели для синтеза голоса с 0.6B и 1.7B параметров. Веса идут в нескольких вариантах: Voice Design позволяет запромптить желаемый голос, Custom Voice идёт с 9 готовыми голосами для китайского, английского, корейского и японского. Кроме этого опубликовали базовые веса модели, для клонирования голосов и как основу для файнтюна. Модель тренировали на 5 миллионах часов аудио на 10 языках, в том числе русском. Поддержка модели уже есть в vLLM и mlx audio, кроме этого она доступна по API. Веса Демо Блогпост @ai_newz

Источник

https://t.me/ai_newz/4373

Канал эйай ньюз · опубликовано 23 янв. 2026 г.

Из этого канала