Если вы когда-нибудь озабочивались тем, чтобы перевести в текст реально БОЛЬШОЙ аудиофайл в текст, то рекомендую вам графическую оболочку от Кая Дрёге из Люцернского университета прикладных наук, которая: ▶️Работает полностью локально на вашем компьютере. ▶️Может различать разных говорящих на 60 языках. ▶️Позволяет просматривать, проверять и исправлять ошибки перевода. ▶️Опирается на Whisper, faster-whisper и pyannote ▶️Может работать под Win, Mac и Linix. Поставил на ночь перегонять в текст 6-часовую запись конференции, которую организаторы поленились разбить на части. Для этого пришлось отключить все окна гуглхрома, который пожирает львиную долю памяти. С транскрипцией в итоге Носкрайб справился на отлично! Страница на гите NoScribe. Рекомендую устанавливать версию для обычных ПК без видеокарты NVIDIA.