Агенты ИИ | AGI_and_RL@AGI_and_RL· 5 852 subs

Вышла приятная обзорка по методам посттренинга LLMов и по ризонингу. С…

3 мар. 2025 г.4 665 views242 forwardsОткрыть в Telegram →

Вышла приятная обзорка по методам посттренинга LLMов и по ризонингу. С красивыми табличками, схемками. Много про разного вида RL который можно применять, цепочки рассуждений, test-time scaling и вот это все Читаем! LLM Post-Training: A Deep Dive into Reasoning Large Language Models https://arxiv.org/abs/2502.21321 И конечно же листик пособирали, тоже приятный. https://github.com/mbzuai-oryx/Awesome-LLM-Post-training PS собираемся и собираем все крутое по нейронкам тут https://t.me/researchim

Источник

https://t.me/AGI_and_RL/976

Канал Агенты ИИ | AGI_and_RL · опубликовано 3 мар. 2025 г.

Из этого канала