Первая новостная заметка от TheInformation в новом году: OpenAI наращивает… — @seeallochnaya

Первая новостная заметка от TheInformation в новом году: OpenAI наращивает усилия по разработке аудио-моделей в преддверии выпуска новых девайсов. Тезисно: — Когда пользователи общаются с ChatGPT голосом, чат-бот использует аудиомодель, отличную от текстовой. Голосовая 4o не получила никаких обновлений после выхода GPT-5, она не умеет думать итд. — Более того фича общения голосом хоть и относительно популярная, всё равно большая часть пользователей использует текст. OpenAI должны сначала приучить пользователей общаться вслух с такими продуктами, как ChatGPT, чтобы перейти к выпуску девайсов. — По словам одного из источников, за последние два месяца OpenAI объединила несколько инженерных, продуктовых и исследовательских команд для работы над улучшением аудиомоделей для будущих устройств компании. Компания планирует выпустить новую аудиомодель в первом квартале 2026 года. — Новая архитектура аудиомодели позволяет генерировать ответы, которые звучат более естественно и эмоционально, а также предоставлять более точную и полную информацию, сообщил источник. Новая модель сможет говорить одновременно с пользователем (чего не умеют текущие модели) и будет лучше реагировать, когда её перебивают. — по словам нескольких источников, OpenAI разрабатывает не одно устройство, а целое семейство девайсов, которые планируется выпускать постепенно. Среди идей, которые обсуждала компания — умные очки и смарт-динамик без дисплея. Ожидается, что взаимодействие с этим устройством будет осуществляться преимущественно с помощью голоса.

Из этого канала