Команда ML Т-Банка выпустила обновление языковых моделей T-Pro 2.1 и T-Lite 2.1 Основной фокус релиза — улучшение точного следования инструкциям (Instruction Following) и Tool Calling. Для достижения результата команда разработала собственный пайплайн генерации синтетических данных для обучения и применила RL-обучение (GRPO) с гибридной reward-функцией, которая одновременно проверяет формальную корректность и осмысленность ответа, что позволило избежать проблемы “reward hacking”. В результате дообучения на синтетических данных и применения RL-обучения с гибридным ревардом модели стали стабильнее в продакшене, точнее держат заданный формат, увереннее работают в многошаговых агентских сценариях и при этом сохраняют скорость и общее качество генерации. T-Pro 2.1 (32B) позиционируется как оптимальный выбор для сложных русскоязычных систем, а T-Lite 2.1 (8B) — как практичное решение для развертывания с ограниченными ресурсами. Обе модели доступны под открытой лицензией Apache 2.0.
Команда ML Т-Банка выпустила обновление языковых моделей T-Pro 2.1 и T-Lite 2.1…
Из этого канала
- #8544Google релизнули новую версию своего «LLM-микроскопа» – Gemma Scope 2 Это…
Google релизнули новую версию своего «LLM-микроскопа» – Gemma Scope 2 Это модель, а точнее набор инструментов (interpretability tools), предназначенный для…
- #8545ARC-AGI 2, фактически, можно признавать решенным: система от стартапа Poetiq…
ARC-AGI 2, фактически, можно признавать решенным: система от стартапа Poetiq выбила ~75% Про подход этих ребят мы уже писали тут.
- #8546«Плотность ИИ на гигабайт в Tesla на порядок выше, чем где бы то ни было» –…
«Плотность ИИ на гигабайт в Tesla на порядок выше, чем где бы то ни было» – Илон Маск Так он прокомментировал твит Андрея Карпаты о том, что Tesla и Waymo…
- #8542POV: ИИ-компании смотрят на те самые 300ТБ Spotify треков на Anna’s Archive
POV: ИИ-компании смотрят на те самые 300ТБ Spotify треков на Anna’s Archive
- #8541GLM-4.7 – новая опенсорсная сота для кодинга Похоже, новая китайская звезда –…
GLM-4.7 – новая опенсорсная сота для кодинга Похоже, новая китайская звезда – это стартап Z.ai.