"Опубликовали статью ""Confidence Is All You Need"" о способности языковых моделей выполнять роль функции наград (применяются в обучении с подкреплением — DeepSeek R1 яркий тому пример) для самостоятельного улучшения качества генерации текста на основе внутренней уверенности в своих ответах. В этой работе получилась интересная (хоть и простая) математика, и потенциально такая работа может дать возможность улучшать качество моделей даже без награды. Апвоутнуть можно тут."
"Опубликовали статью ""Confidence Is All You Need"" о способности языковых…
Из этого канала
- #214С коллегами из Сбера и ГК «Промомед» на ПМЭФ-2025 подписали соглашение о…
С коллегами из Сбера и ГК «Промомед» на ПМЭФ-2025 подписали соглашение о внедрении ИИ для более быстрой разработки лекарств.
- #215Сегодня на ПМЭФ-2025 подписали трехстороннее соглашение с коллегами из Р-Фарм и…
Сегодня на ПМЭФ-2025 подписали трехстороннее соглашение с коллегами из Р-Фарм и Сбера.
- #216Принял участие в программе «Очевидно. Вероятно» на ОТР — поговорили с Арутюном…
Принял участие в программе «Очевидно. Вероятно» на ОТР — поговорили с Арутюном Ишхановичем Аветисяном о том, зачем нам нужна наука.
- #209⚡️⚡️⚡️На прошлой неделе мы в AIRI зарелизили очень крутую работу в рамках трека…
⚡️⚡️⚡️На прошлой неделе мы в AIRI зарелизили очень крутую работу в рамках трека «Генеративное проектирование» — cadrille: Multi-modal CAD Reconstruction with…
- #2088 июня 2025 года исполнилось 100 лет со дня рожденья Гурия Ивановича Марчука —…
8 июня 2025 года исполнилось 100 лет со дня рожденья Гурия Ивановича Марчука — последнего президента академии наук СССР, основателя и многолетнего директора…