Показали новую модель для голоса `gpt-realtime` – она натренирована понимать речь не переводя ее в текст, а сразу нативно обрабатывать аудио Модель умеет в эмоции, в акценты, в много языков, принимает на входе картинки и все это в режиме реального времени, играться можно в кабинете API OpenAI в разделе audio