"Неужели мы наблюдаем возрождение эволюционных стратегий как альтернативы RL? Я помню ту работу 2017 года от OpenAI и Суцкевера в частности ""Evolution Strategies as a Scalable Alternative to Reinforcement Learning"" (https://arxiv.org/abs/1703.03864), где впервые ES показали себя достойной альтернативой RL. Я сам писал про это в начале 2017 года (https://moocaholic.medium.com/2017-the-year-of-neuroevolution-30e59ae8fe18). Но в мир LLM эти подходы так и не пришли, возможно потому что на миллиардах параметров оно сходу не работало. Свежая работа ""Evolution Strategies at Scale: LLM Fine-Tuning Beyond Reinforcement Learning"" (https://arxiv.org/abs/2509.24372) устраняет этот пробел. Реализация настолько простая, что непонятно, почему это сделали только в 2025-м... https://t.me/gonzo_ML_podcasts/936"
"Неужели мы наблюдаем возрождение эволюционных стратегий как альтернативы RL? Я…
Из этого канала
- #4093Интересно, что параллельно с LLM/VLM Google продолжает совершенствовать модели…
Интересно, что параллельно с LLM/VLM Google продолжает совершенствовать модели для роботов, свежая — Gemini Robotics 1.5.
- #4095Дожили... Документ переполнился
Дожили... Документ переполнился
- #4097Hierarchical Reasoning Model Guan Wang, Jin Li, Yuhao Sun, Xing Chen, Changling…
Hierarchical Reasoning Model Guan Wang, Jin Li, Yuhao Sun, Xing Chen, Changling Liu, Yue Wu, Meng Lu, Sen Song, Yasin Abbasi Yadkori Статья:…
- #4091Вышел новый State of AI report 2025! https://www.stateof.ai/ Всегда достойно…
Вышел новый State of AI report 2025! https://www.stateof.ai/ Всегда достойно изучения.
- #4089Прикольная свежая работа от Superintelligence Labs, включая Руслана…
Прикольная свежая работа от Superintelligence Labs, включая Руслана Салахутдинова.