ресечим/делаем (c) AI@researchim· 1 565 subs

https://github.com/ArtyomZemlyak/rulka Собрал правки в одной репе по обучению…

14 февр. 2026 г.0 viewsОткрыть в Telegram →

https://github.com/ArtyomZemlyak/rulka Собрал правки в одной репе по обучению RL модельки над trackmania. Пока не успел со всеми кишками разобраться, чтобы понимать как все работает и почему, как модель менять и все такое. Но уже должна быть возможность запускаться с минимальными проблемами.

Источник

https://t.me/researchim/6000

Канал ресечим/делаем (c) AI · опубликовано 14 февр. 2026 г.

Из этого канала

#6001Сделал мини релиз новый…
Сделал мини релиз новый https://github.com/ArtyomZemlyak/rulka/releases/tag/v1.2.0 - Там апдейтнутая документация уже у меня развернутая…
#6002The Bitter Lesson Behind Building Agentic RL in Terminal Environments…
The Bitter Lesson Behind Building Agentic RL in Terminal Environments…
#6003CM2: Reinforcement Learning with Checklist Rewards for Multi-Turn and…
CM2: Reinforcement Learning with Checklist Rewards for Multi-Turn and Multi-Step Agentic Tool Use https://arxiv.org/abs/2602.12268…
#5999[2602.08234] SkillRL: Evolving Agents via Recursive Skill-Augmented…
[2602.08234] SkillRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning https://arxiv.org/abs/2602.08234…
#5997Towards Autonomous Mathematics Research https://arxiv.org/abs/2602.10177/…
Towards Autonomous Mathematics Research https://arxiv.org/abs/2602.10177/ https://www.alphaxiv.org/ru/overview/2602.10177