Gemini 3.5 Live Translate Новая аудиомодель для перевода речи в речь практически в реальном времени. Генерирует речь непрерывно, отставая от говорящего на пару секунд. При этом модель автоматически определяет более 70 языков без ручной настройки; поддержка мультиязычного ввода работает «из коробки». Сохраняет интонацию, темп и высоту голоса говорящего, устойчива к шуму и работает в любых акустических условиях. Странно, что они реализовали это только сейчас, будто давно не хватало такого переводчика в реальном времени от создателей главного переводчика в мире. Сейчас доступно превью через Gemini Live API и в Google AI Studio. Также есть на LiveKit и Pipecat. Обновление в приложении Google Translate для Android и iOS: подключаем наушники и тестируем. В Google Meet также внедрили. Новая функция для Android. Режим listening mode: подносите телефон к уху, как при обычном звонке, и слышите перевод прямо через разговорный динамик. Может заменить гида на экскурсии на иностранном языке; да и в целом удобно, если нет наушников под рукой. Google Blog Космос! Сейчас в Турции пригодилось бы. Это миф, что тут все говорят по-русски или по-английски. 🟪 MAX ❤️ TG
Gemini 3.5 Live Translate Новая аудиомодель для перевода речи в речь…
Из этого канала
- #16888На уничтожение VPN в России хотят направить ещё минимум 1,3 млрд (!) рублей —…
На уничтожение VPN в России хотят направить ещё минимум 1,3 млрд (!) рублей — эти деньги пойдут на покупку инфраструктуры для работы систем фильтрации трафика.
- #16885В работе мессенджера Max заметили проблему с оптимизацией: приложение чрезмерно…
В работе мессенджера Max заметили проблему с оптимизацией: приложение чрезмерно нагружает систему.
- #16884В 1969 году социолог Стэнли Милгрэм вышел на улицу Нью-Йорка и смотрел вверх.…
В 1969 году социолог Стэнли Милгрэм вышел на улицу Нью-Йорка и смотрел вверх. Через минуту рядом остановились четыре прохожих. Через три минуты — толпа.