Что сегодня в тренде в AI-индустрии: Chandra OCR-модель, которая преобразует изображения в структурированные форматы markdown, HTML и JSON. MCP Server для 27 публичных API Бразилии Реализация протокола MCP для доступа к различным государственным и общественным данным Бразилии. Mistral AI анонсировала Voxtral TTS (3B) Открытая модель для преобразования текста в речь превосходит ElevenLabs Flash v2.5. Она требует ~3 ГБ VRAM, обеспечивает инференс с задержкой 90 мс и поддерживает девять языков. Intel выпустит доступную видеокарту с 32 ГБ VRAM Intel запускает Arc Pro за $949 с 32 ГБ видеопамяти и пропускной способностью 608 ГБ/с. Карта ориентирована на бюджетный локальный инференс нейросетей. Реализация TurboQuant на PyTorch Код для сжатия KV-кеша LLM на основе метода от Google. Решение обеспечивает 5-кратное сжатие при 3-битном квантовании с сохранением точности внимания на 99.5%. Обсуждение значимости объема оперативной памяти для локальных LLM Пользователи отмечают, что наличие 96 ГБ DDR5 RAM значительно расширяет возможности работы с большими моделями в домашних условиях. Инструмент для очистки отказов ИИ в Codex CLI Легкая утилита на Python для удаления отказов (refusal responses) из файлов сессий в командной строке Codex. wewrite — AI-пайплайн для создания контента Инструмент для Claude Code, автоматизирующий полный цикл подготовки статей: от поиска трендов и написания текста до SEO и генерации изображений. usecomputer — быстрый CLI для автоматизации интерфейса Инструмент для агентных систем, позволяющий ИИ управлять рабочим столом через снапшоты доступности, клики, ввод текста и прокрутку. RotorQuant — ускоренная альтернатива TurboQuant Метод квантования на базе роторов Клиффорда, работающий в 10–19 раз быстрее TurboQuant. Подход требует в 44 раза меньше параметров при сопоставимой точности.