Т‑Банк завёз открытый свежачок: T-pro 2.0 32B русскоязычная модель на базе Qwen3‑32B. Модель прогнали через 40 млрд токенов претрейна (треть из них reasoning), потом долили ~500к SFT‑промптов и ещё 100к пар для preference‑tuning, так что она заметно лучше думает на русском. На публичных бенчах получаем +5‑10 процентных пунктов к голому Qwen3‑32B: ruMMLU 79 % (+5), Ru‑Arena‑Hard 87,6 % (+4,4), MERA 66 % (+7,6) — среди локальных языковых моделей это один из лучших результатов прямо сейчас. Детали тренировки обещают завтра, на Turbo ML Conf. Модель — гибридный ризонер, с 32к контекста, которые растягиваются до 131к при помощи YaRN. Авторы опубликовали не просто чекпоинт — релизнули сразу и официальную fp8 версию плюс пачку GGUF, так что модель могут использовать обычные юзеры без плясок с бубном. Натренировали и Eagle драфт модель, которая даёт до 60% прироста в скорости инференса при маленьких батчах — скорость растёт с 69 токенов в секунду до 110. Лицензия — Apache 2.0, так что можно спокойно юзать в любых целях, в том числе коммерческих. Веса @ai_newz
Т‑Банк завёз открытый свежачок: T-pro 2.0 32B русскоязычная модель на базе…
Из этого канала
- #4045Runway Act-Two - mocap + нейронный рендеринг Пока мы не научились полностью…
Runway Act-Two - mocap + нейронный рендеринг Пока мы не научились полностью контролировать действия персонажа и делать качественный липсинк, у актёров всё ещё…
- #4046Нам не скажут, что началось восстание машин, но будут знаки. @ainewz
Нам не скажут, что началось восстание машин, но будут знаки. @ainewz
- #4047Нейродайджест за неделю (#78) LLM - ChatGPT Agent — Мощный агент для выполнения…
Нейродайджест за неделю (#78) LLM - ChatGPT Agent — Мощный агент для выполнения рутинных задач с доступом в интернет. Не первые, но, возможно, лучшие.
- #4043ChatGPT Agent — Deep Research и Operator теперь одно целое Внутри теперь единая…
ChatGPT Agent — Deep Research и Operator теперь одно целое Внутри теперь единая модель которая может пользоваться всеми тулами: текстовый и визуальный…
- #4042В Le Chat закинули фич Самое интересное — завезли Deep Research. Он явно не…
В Le Chat закинули фич Самое интересное — завезли Deep Research. Он явно не самый лучший, но за счёт партнёрства Cerebras и Mistral явно самый быстрый на…