OpenAI представила gpt-realtime — продвинутую модель для голосовых агентов с новыми API-возможностями. Технические новшества: - gpt-realtime — новая модель speech-to-speech, улучшенная по качеству аудио, пониманию инструкций и точности вызова функций. - API Realtime теперь поддерживает: Подключение к удалённым MCP-серверам (интеграция инструментов через URL, автоматизация вызова функций). Ввод изображений (можно отправлять фото/скриншоты вместе с аудио или текстом, модель анализирует визуальный контекст). SIP-телефонию (поддержка звонков через Session Initiation Protocol). - Аудио: Модель генерирует более естественную речь, умеет следовать тонким инструкциям (например, говорить быстро и профессионально или с акцентом). - Интеллект: Улучшено понимание аудио, распознавание невербальных сигналов, переключение языков в реальном времени, точное определение алфавитно-цифровых последовательностей на разных языках. Вся обработка аудио происходит в одной модели и через один API, что снижает задержки и сохраняет нюансы речи (в отличие от традиционных цепочек speech-to-text и text-to-speech). Отдельно хочу отметить улучшения безопасности: модель содержит встроенные классификаторы для предотвращения нарушений, возможность добавлять свои guardrails через Agents SDK. https://openai.com/index/introducing-gpt-realtime/
OpenAI представила gpt-realtime — продвинутую модель для голосовых агентов с…
Из этого канала
- #2449Дайджест статей Как аналитики Авито с помощью ML помогают людям выбирать…
Дайджест статей Как аналитики Авито с помощью ML помогают людям выбирать хорошие авто с пробегом https://habr.com/ru/companies/avito/articles/937610/…
- #2450В предверии презентации Apple, которая пока так и не смогла ничего показать в…
В предверии презентации Apple, которая пока так и не смогла ничего показать в части развития Siri и похоже безнадежно отстала от Google с его Pixel 10 (но как…
- #2451How Salesforce Delivers Reliable, Low-Latency AI Inference Сейчас довольно…
How Salesforce Delivers Reliable, Low-Latency AI Inference Сейчас довольно остро стоит задача по повышению скорости инференса в AI LLM-based решениях.
- #2446Optimizing LinkedIn Sales Navigator’s search pipeline with Spark LinkedIn…
Optimizing LinkedIn Sales Navigator’s search pipeline with Spark LinkedIn провёл масштабную оптимизацию поискового пайплайна для Sales Navigator, переведя…
- #2445#саммари Сегодня в нашем блоге саммари выступления Дениса Афанасьева на митапе…
#саммари Сегодня в нашем блоге саммари выступления Дениса Афанасьева на митапе VTORNIK.Вечер 26 августа.