Ещё про скиллы. Любопытная работа: Compute Optimal Scaling of Skills: Knowledge vs Reasoning __Nicholas Roberts, Niladri Chatterji, Sharan Narang, Mike Lewis, Dieuwke Hupkes__ Статья: https://arxiv.org/abs/2503.10061 На ручное ревью меня не хватает, но если кратко, то scaling laws разные для разных типов задач. Для Knowledge QA лучше модель побольше, а для ризонинга (конкретно кодогенерации) лучше побольше данных. Типа, наверное, можно делать хорошие ризонеры меньшего размера, если их больше обучать. Автоматическое ревью тут: * Английский TL;DR * Русский автообзор
Ещё про скиллы. Любопытная работа: Compute Optimal Scaling of Skills:…
Из этого канала
- #3485Anthropic продолжает копать в AI alignment и выпустил большую свежую работу (63…
Anthropic продолжает копать в AI alignment и выпустил большую свежую работу (63 страницы) про аудит моделей на наличие hidden objectives.
- #3487Пятничное, если вы ещё не видели. Тесла и нарисованная дорога:…
Пятничное, если вы ещё не видели. Тесла и нарисованная дорога: https://futurism.com/tesla-wall-autopilot Само видео:…
- #3488Валя Малых будет разбирать свою статью.
Валя Малых будет разбирать свою статью.
- #3481Интересная тема: “Moore’s Law for AI agents” Как со временем растёт длина…
Интересная тема: “Moore’s Law for AI agents” Как со временем растёт длина задач, с которыми могут работать агенты.
- #3480"Just for fun продолжаю автоматическую публикацию обзоров статей, которые…
"Just for fun продолжаю автоматическую публикацию обзоров статей, которые вручную разбирать всё равно не буду.