Яндекс запускает бета-тест YandexGPT 5 с reasoning-режимом Яндекс начал публичное бета-тестирование YandexGPT 5 с reasoning (режим рассуждений). Новая модель анализирует задачи, выстраивает логические цепочки и показывает пользователю весь процесс рассуждений в реальном времени – это то, что сейчас делают все SOTA-модели. В техническом плане тренировку модели начинали с SFT чекпоинта YandexGPT 5 Pro — это даёт уверенный warm-start. Далее дообучали в несколько этапов: online-RL GRPO (по аналогии с разработками R1 на реворде с однозначными ответами), потом offline-RL-фаза со сравнением и дообучением на лучших генерациях, а затем RLHF. Трейн датасет включает не только математические задачи, но и бизнес-сценарии: классификацию, извлечение информации из текстов и суммаризацию. Бенчей пока что нет, но это норма для бета тестов — интересно проследить, что будет на релизе. В настройках Алисы можно выбрать одну из двух моделей: YandexGPT 5 с рассуждениями или опенсорсную DeepSeek-R1, развернутую на инфраструктуре Яндекса. По дефолту система выбирает между ними случайным образом при каждом запросе, но можно и вручную выбрать конкретную. Выбор из двух моделей сделали, чтобы понять поток запросов на рассуждение и собрать датасет для дообучения модели, а также проверить гипотезу полезности такого продукта для пользователя — все-таки на ru рынке это первый эксперимент с ризонингом. Доступность альтернативы — признак уверенности в своей модели яндексоидов, ведь R1 - это крайне сильная модель. Но ждем бенчмарков! @ai_newz
Яндекс запускает бета-тест YandexGPT 5 с reasoning-режимом Яндекс начал…
Из этого канала
- #3837Microsoft выпустила веса BitNet модели (спустя год) Я уже писал о BitNet —…
Microsoft выпустила веса BitNet модели (спустя год) Я уже писал о BitNet — методе тренировки моделей сразу квантизированными до 1.58 бит, но тогда авторы…
- #3838Anthropic запустили бету своего Deep Research В отличии от конкурентов, он…
Anthropic запустили бету своего Deep Research В отличии от конкурентов, он может искать не только по интернету, но и по персональным данным — этому помогают…
- #3839Трамп, конечно, рыночек хорошо колбасит. С такими тарифами американский проект…
Трамп, конечно, рыночек хорошо колбасит. С такими тарифами американский проект Stargate может тоже под вопрос стать. @ainewz
- #3832OpenAI показали GPT-4.1 Идёт в трёх размерах — GPT 4.1, GPT 4.1 Mini и GPT 4.1…
OpenAI показали GPT-4.1 Идёт в трёх размерах — GPT 4.1, GPT 4.1 Mini и GPT 4.1 Nano.
- #3831На Image Arena ещё одна загадочная t2i модель заняла первое место Что за Mogao…
На Image Arena ещё одна загадочная t2i модель заняла первое место Что за Mogao — непонятно, но голосов уже достаточно много чтобы уверенно судить о высоком…