Топ обсуждений в AI-сообществе сегодня: MiniCPM-o 4.5 теперь доступна локально на Mac Полнодуплексная коммуникация с низкой задержкой теперь работает прямо на вашем Mac через официальный Docker-образ. Критика Ollama: почему это не просто развлечение, а необходимость Дискуссия о проблемах платформы Ollama и почему важно открыто говорить о её недостатках. Voxtral Mini 4B Realtime 2602 от Mistral AI Мультиязычная модель для транскрипции речи в реальном времени — один из первых open-source решений с точностью офлайн-систем при минимальной задержке. EpsteIn: проверьте свои LinkedIn-связи на упоминания в документах Эпштейна Инструмент для поиска совпадений между вашими контактами в LinkedIn и лицами из материалов дела Эпштейна. Google Research представила Sequential Attention Новый метод делает AI-модели быстрее и экономичнее без потери точности. LaTo: новая техника для точного редактирования лиц от Alibaba Официальный репозиторий статьи о Landmark-tokenized Diffusion Transformer для детального редактирования человеческих лиц. Qwen3-Coder-Next: языковая модель для coding-агентов Открытая модель, специально разработанная для coding-агентов и локальной разработки, доступна в формате GGUF. Неофициальный Python-клиент для распознавания речи входной системы Doubao Клиент для работы с API распознавания речи китайской входной системы Doubao (豆包输入法). Tencent Youtu-VL-4B-Instruct: новая vision-language модель Компактная мультимодальная модель от Tencent с открытыми весами и технической документацией. Опыт создания частного кластера H100: почему PCIe-серверы не подошли для обучения Практические выводы о строительстве GPU-кластера на H100 и ограничениях PCIe-архитектуры при тренировке моделей.