Несколько дней не видел обзорок по тест тайм скейлингам, RLям, CoT, агентам и вот этому всему. (выходные же были) Даже как-то не по себе начало становиться 😰 Но ребята исправляют ситуацию. И кстати понравилось, качественная работа Много красивых графичков, табличек, карт и прочего. Подсобрали статьи в том числе и свежайшие жостко читаем Generative AI Act II: Test Time Scaling Drives Cognition Engineering https://arxiv.org/abs/2504.13828 https://github.com/GAIR-NLP/cognition-engineering PS и приходите в https://t.me/researchim другие статейки читать и проектики делать
Несколько дней не видел обзорок по тест тайм скейлингам, RLям, CoT, агентам и…
Из этого канала
- #1058RL не развивает потенциал рассуждений LLM (by Tsinghua) RL с верифицируемыми…
RL не развивает потенциал рассуждений LLM (by Tsinghua) RL с верифицируемыми наградами (RLVR) — один из самых популярных подходов для прокачки…
- #1059RL В С Ё 😕 Кстати я эту статью в https://t.me/researchim еще с утра положил и…
RL В С Ё 😕 Кстати я эту статью в https://t.me/researchim еще с утра положил и вы могли ее еще раньше там прочитать) заходите
- #1061Давно как-то не доходили руки ничего написать в канал: то по работе дела, то…
Давно как-то не доходили руки ничего написать в канал: то по работе дела, то статей интересных не было в моменте, то просто не хотелось.
- #1056"Добро пожаловать в эру обучения на опыте (от Дэвида Сильвера и Ричарда…
"Добро пожаловать в эру обучения на опыте (от Дэвида Сильвера и Ричарда Саттона) Мол хорошие данные полученные от людей к концу подходят.
- #1055Superhuman vending bot Агенту дают 500usd, автомат на три лотка, чаржат по 2usd…
Superhuman vending bot Агенту дают 500usd, автомат на три лотка, чаржат по 2usd в день за использование автомата, а еще 3 тулa: - посмотреть информацию о…