gonzo-обзоры ML статей@gonzo_ML· 24 246 subs

Пост про RL для ризонинг моделей https://aweers.de/blog/2026/rl-for-llms/

21 мар. 2026 г.3 777 views106 forwardsОткрыть в Telegram →

Пост про RL для ризонинг моделей https://aweers.de/blog/2026/rl-for-llms/

Источник

https://t.me/gonzo_ML/4998

Канал gonzo-обзоры ML статей · опубликовано 21 мар. 2026 г.

Из этого канала

#4999Вчера не нашёл подходящей картинки, а сегодня нашёл. R.I.P.
Вчера не нашёл подходящей картинки, а сегодня нашёл. R.I.P.
#5000Обновлённая V-JEPA 2.1, хороша и для видео, и для картинок. Несмотря на…
Обновлённая V-JEPA 2.1, хороша и для видео, и для картинок. Несмотря на минорное различие в версии, разница в качестве колоссальная.
#5004Long live RNN! M2RNN: Non-Linear RNNs with Matrix-Valued States for Scalable…
Long live RNN! M2RNN: Non-Linear RNNs with Matrix-Valued States for Scalable Language Modeling Mayank Mishra, Shawn Tan, Ion Stoica, Joseph Gonzalez, Tri Dao…
#4994Кто хочет написать новую ОС? AgentOS: From Application Silos to a Natural…
Кто хочет написать новую ОС? AgentOS: From Application Silos to a Natural Language-Driven Data Ecosystem Rui Liu, Tao Zhe, Dongjie Wang, Zijun Yao, Kunpeng…
#4989"Добыча ценного реварда из текущего взаимодействия агента со средой.…
"Добыча ценного реварда из текущего взаимодействия агента со средой. OpenClaw-RL: Train Any Agent Simply by Talking Yinjie Wang, Xuyang Chen, Xiaolong Jin,…