челы собрали много статей по llm рлю, жаль что несколько месяцев не обновляли https://github.com/TsinghuaC3I/Awesome-RL-for-LRMs