https://github.com/ArtyomZemlyak/rulka Собрал правки в одной репе по обучению RL модельки над trackmania. Пока не успел со всеми кишками разобраться, чтобы понимать как все работает и почему, как модель менять и все такое. Но уже должна быть возможность запускаться с минимальными проблемами.
https://github.com/ArtyomZemlyak/rulka Собрал правки в одной репе по обучению…
0 viewsОткрыть в Telegram →
Из этого канала
- #6001Сделал мини релиз новый…
Сделал мини релиз новый https://github.com/ArtyomZemlyak/rulka/releases/tag/v1.2.0 - Там апдейтнутая документация уже у меня развернутая…
- #6002The Bitter Lesson Behind Building Agentic RL in Terminal Environments…
The Bitter Lesson Behind Building Agentic RL in Terminal Environments…
- #6003CM2: Reinforcement Learning with Checklist Rewards for Multi-Turn and…
CM2: Reinforcement Learning with Checklist Rewards for Multi-Turn and Multi-Step Agentic Tool Use https://arxiv.org/abs/2602.12268…
- #5999[2602.08234] SkillRL: Evolving Agents via Recursive Skill-Augmented…
[2602.08234] SkillRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning https://arxiv.org/abs/2602.08234…
- #5997Towards Autonomous Mathematics Research https://arxiv.org/abs/2602.10177/…
Towards Autonomous Mathematics Research https://arxiv.org/abs/2602.10177/ https://www.alphaxiv.org/ru/overview/2602.10177