Первая новостная заметка от TheInformation в новом году: OpenAI наращивает усилия по разработке аудио-моделей в преддверии выпуска новых девайсов. Тезисно: — Когда пользователи общаются с ChatGPT голосом, чат-бот использует аудиомодель, отличную от текстовой. Голосовая 4o не получила никаких обновлений после выхода GPT-5, она не умеет думать итд. — Более того фича общения голосом хоть и относительно популярная, всё равно большая часть пользователей использует текст. OpenAI должны сначала приучить пользователей общаться вслух с такими продуктами, как ChatGPT, чтобы перейти к выпуску девайсов. — По словам одного из источников, за последние два месяца OpenAI объединила несколько инженерных, продуктовых и исследовательских команд для работы над улучшением аудиомоделей для будущих устройств компании. Компания планирует выпустить новую аудиомодель в первом квартале 2026 года. — Новая архитектура аудиомодели позволяет генерировать ответы, которые звучат более естественно и эмоционально, а также предоставлять более точную и полную информацию, сообщил источник. Новая модель сможет говорить одновременно с пользователем (чего не умеют текущие модели) и будет лучше реагировать, когда её перебивают. — по словам нескольких источников, OpenAI разрабатывает не одно устройство, а целое семейство девайсов, которые планируется выпускать постепенно. Среди идей, которые обсуждала компания — умные очки и смарт-динамик без дисплея. Ожидается, что взаимодействие с этим устройством будет осуществляться преимущественно с помощью голоса.
Первая новостная заметка от TheInformation в новом году: OpenAI наращивает…
Из этого канала
- #3249DiffThinker: Towards Generative Multimodal Reasoning with Diffusion Models…
DiffThinker: Towards Generative Multimodal Reasoning with Diffusion Models (блог) Прикольная статья, показывающая новую (хотя думаю схожие работы были)…
- #3254ВОСЕМЬ советов от создателя Claude Code, чтобы перестать вайбкодить в Новом…
ВОСЕМЬ советов от создателя Claude Code, чтобы перестать вайбкодить в Новом году и стать 10x инженером: 1) Запускать 5 терминалов в параллель + 5-10 вкладок на…
- #3258Почтим память легенды — StackOverflow почти всё. За декабрь на ресурсе было…
Почтим память легенды — StackOverflow почти всё. За декабрь на ресурсе было размещено 3710 вопросов, в прошлом январе 22.5 тыс — почти в 10 раз меньше пика…
- #3247Отдельно картинка с архитектурой. Слева — обычный residual, по центру — как…
Отдельно картинка с архитектурой. Слева — обычный residual, по центру — как было у ByteDance, и в чём собственно идея HyperConnection.
- #3245Главных результата 2: 1) значение функции ошибки меньше, чем у обычного…
Главных результата 2: 1) значение функции ошибки меньше, чем у обычного трансформера, даже в пересчёте на количество вычислений при тренировке (все приёмы выше…