🤯 Китайцы из Qwen устроили день релизов и за пару часов выложили три нейросети передового уровня — они стали лидерами для большого спектра задач. Qwen3-TTS-Flash • Лучшая по стабильности модель для преобразования текста в речь • Доступно 14 выразительных голосов и поддержка 10 языков, включая русский • Задержка всего 97 мс (одна десятая секунды!) Qwen-Image-Edit-2509 • «Убийца» Nano Banana научился редактировать сразу несколько изображений и смешивать их • Гораздо лучше сохраняет контекст, лица и объекты • Добавили встроенный ControlNet для изменения поз Qwen3-Omni • Мультимодальная модель «всё в одном» — обрабатывает текст, изображения, аудио и видео • Первое место на 22 из 36 тематических бенчмарках, поддержка 119 языков • Обрабатывает аудио длиной до 30 минут с задержкой 211 мс В рядах топовых моделей пополнение — забираем ✨ @notboring_tech