Новое поколение синтеза речи в ГигаЧате Разрабочики команды синтеза речи в Сбере запустили новое поколение голосового режима Гигачата. Голоса теперь собираются не из «универсального диктора», а из специализированных моделей: Freespeech для живого общения, голоса операторов колл-центров, подкастная и классическая дикторская подача. В результате ассистент говорит ближе к человеку, а не к автоответчику — со вздохами и с более естественной интонацией. Технически это полностью свой стек: GigaChat 3b в роли языковой модели, кастомный токенизатор звука и авторегрессионный синтез вместо диффузий. Команда отдельно поработала над токенизацией речи, системными промптами для стиля голоса, учетом длинного контекста и клонированием — за счёт этого новый синтез сильно обгоняет прошлое поколение по внутренним метрикам качества и естественности. На фоне конкурентов типа Алисы упор идёт не на «дикторский» голос, а на живость и выразительность речи. Статья на хабре @ai_newz
Новое поколение синтеза речи в ГигаЧате Разрабочики команды синтеза речи в…
Из этого канала
- #4275Claude Opus 4.5 Anthropic выпустили Claude Opus 4.5. Я ей уже успел…
Claude Opus 4.5 Anthropic выпустили Claude Opus 4.5. Я ей уже успел попользоваться, мне понравилось.
- #4276😮 Black Forest Labs выпустили FLUX.2 Теперь решает возможность быстро, без…
😮 Black Forest Labs выпустили FLUX.2 Теперь решает возможность быстро, без заморочек, а главное, консистентно редактировать изображения.
- #4277Илья дал большое интервью: https://www.youtube.com/watch?v=aR20FWCCjAs Вот…
Илья дал большое интервью: https://www.youtube.com/watch?v=aR20FWCCjAs Вот главное: – Сейчас модели выглядят намного умнее на тестах, чем в реальных задачах:…
- #4273OpenAI сделали DeepResearch для шоппинга С высоты птичьего полёта shopping…
OpenAI сделали DeepResearch для шоппинга С высоты птичьего полёта shopping research это тот же Deep Research — система задает уточняющие вопросы, после чего…
- #4268"Как генерить презентации? Продолжение рубрики с обзором AI продуктов. Я…
"Как генерить презентации? Продолжение рубрики с обзором AI продуктов. Я рассматривал инструменты с точки зрения человека, которому нужно время от времени…