Вышла приятная обзорка по методам посттренинга LLMов и по ризонингу. С красивыми табличками, схемками. Много про разного вида RL который можно применять, цепочки рассуждений, test-time scaling и вот это все Читаем! LLM Post-Training: A Deep Dive into Reasoning Large Language Models https://arxiv.org/abs/2502.21321 И конечно же листик пособирали, тоже приятный. https://github.com/mbzuai-oryx/Awesome-LLM-Post-training PS собираемся и собираем все крутое по нейронкам тут https://t.me/researchim