ресечим/делаем (c) AI@researchim· 1 565 subs

Small Reward Models via Backward Inference https://arxiv.org/abs/2602.13551…

19 февр. 2026 г.0 viewsОткрыть в Telegram →

Small Reward Models via Backward Inference https://arxiv.org/abs/2602.13551 https://www.alphaxiv.org/ru/overview/2602.13551

Источник

https://t.me/researchim/6043

Канал ресечим/делаем (c) AI · опубликовано 19 февр. 2026 г.

Из этого канала

#6044Operationalising the Superficial Alignment Hypothesis via Task Complexity…
Operationalising the Superficial Alignment Hypothesis via Task Complexity https://arxiv.org/abs/2602.15829 https://www.alphaxiv.org/ru/overview/2602.15829
#6045@tokareviv мне кажется надо отдельный блок vibecoding создавать
@tokareviv мне кажется надо отдельный блок vibecoding создавать
#6046Так других кодингов нет
Так других кодингов нет
#6042RL Excursions during Pretraining: How early is too early for On-policy…
RL Excursions during Pretraining: How early is too early for On-policy Learning? https://rl-excursions.github.io/
#6041https://github.com/Shekswess/tiny-reasoning-language-model
https://github.com/Shekswess/tiny-reasoning-language-model