"Продолжается развитие интересной линейки Dreamer, моделей, способных обучаться ""в воображении"", внутри выученной модели мира. Мы упоминали эти модели неоднократно (https://t.me/gonzo_ML/1791), и вообще World Models — одна из моих любимых тем (https://t.me/gonzo_ML/3176). Текущая версия Dreamer 4 обучила world model на (не самой большой) куче видео, а затем внутри модели мира выучила полиси и сумела накрафтить алмаз в майнкрафте. Скор небольшой, всего 0.7% успеха, но у VPT и VLA там вообще ноль, хотя данных в обучении в сто раз больше. В общем любопытная движуха. Подробнее: https://t.me/gonzo_ML_podcasts/1150"
"Продолжается развитие интересной линейки Dreamer, моделей, способных обучаться…
Из этого канала
- #4177"Графовый LSTM подвезли, gLSTM. Что сделано? В статье пересматривается проблема…
"Графовый LSTM подвезли, gLSTM. Что сделано? В статье пересматривается проблема ""over-squashing"" в графовых нейронных сетях (GNN), разделяя её на два…
- #4179Когда ты думал, что оно грокнуло, а оно, зараза, переобучилось 😹
Когда ты думал, что оно грокнуло, а оно, зараза, переобучилось 😹
- #4180The Principles of Diffusion Models: From Origins to Advances Chieh-Hsin Lai,…
The Principles of Diffusion Models: From Origins to Advances Chieh-Hsin Lai, Yang Song, Dongjun Kim, Yuki Mitsufuji, Stefano Ermon Статья:…
- #4173Не про архиваторы. Binary Retrieval-Augmented Reward, или Binary RAR, — это…
Не про архиваторы. Binary Retrieval-Augmented Reward, или Binary RAR, — это очень простой способ побороть галлюцинации модели, сохранив при этом её…
- #4172Extropic анонсировал своё новое железо…
Extropic анонсировал своё новое железо http://extropic.ai/writing/inside-x0-and-xtr-0 Мы писали про эту и другие интересные темы тут