Большой обзор про модели мира для роботов. World Model for Robot Learning: A Comprehensive Survey __Bohan Hou, Gen Li, Jindou Jia, Tuo An, Xinying Guo, Sicong Leng, Haoran Geng, Yanjie Ze, Tatsuya Harada, Philip Torr, Oier Mees, Marc Pollefeys, Zhuang Liu, Jiajun Wu, Pieter Abbeel, Jitendra Malik, Yilun Du, Jianfei Yang__ Статья: https://arxiv.org/abs/2605.00080v1 Сайт: https://ntumars.github.io/wm-robot-survey/ Код: https://github.com/NTUMARS/Awesome-World-Model-for-Robotics-Policy Ревью: https://arxiviq.substack.com/p/world-model-for-robot-learning-a # TL;DR ЧТО сделали: Статья предлагает всеобъемлющую, ориентированную на политики управления таксономию интеграции мировых моделей (world models) в обучение роботов. Авторы систематизируют область: от раздельных пайплайнов до единых архитектур с общим бэкбоном, а также по их функциональной роли — от пассивных предсказателей видео до интерактивных симуляторов для обучения с подкреплением. ПОЧЕМУ это важно: Чисто реактивные Vision-Language-Action (VLA) модели достигают потолка в задачах, требующих рассуждений на длинных горизонтах, и страдают от накопления ошибок. Внедрение предиктивных структур даёт агентам причинно-следственное предвидение, физическую привязку к реальности и возможность генерировать масштабные синтетические данные. Всё это критически необходимо, чтобы вывести воплощённый ИИ на уровень надёжной работы в реальном мире. Для практиков: Обзор фундаментально переосмысливает пользу мировых моделей в робототехнике. Перцептивный реализм (правдоподобная картинка) вторичен по отношению к согласованности предсказаний с действиями и функциональной полезности. Унифицируя различные архитектуры в рамках единого вероятностного фреймворка, авторы показывают стратегический сдвиг: область уходит от изолированных моделей генерации видео к интернализированным когнитивным механизмам, позволяющим роботам планировать роллауты и исправлять ошибки до совершения физического действия. Обозревать здесь: https://t.me/gonzo_ML_podcasts/3640
Большой обзор про модели мира для роботов. World Model for Robot Learning: A…
Из этого канала
- #5393Про разную экономику разметки для реворда и для динамики среды при обучении…
Про разную экономику разметки для реворда и для динамики среды при обучении моделей мира.
- #5396Рабочая диффузия приходит в язык. Continuous Diffusion Meets Language Modeling:…
Рабочая диффузия приходит в язык. Continuous Diffusion Meets Language Modeling: A Strategic Analysis of Embedded Language Flows Keya Hu, Linlu Qiu, Yiyang Lu,…
- #5402"С одной стороны весь файнтюнинг безопасности можно обойти, воздействуя на один…
"С одной стороны весь файнтюнинг безопасности можно обойти, воздействуя на один единственный нейрон, с другой стороны если грохнуть одну конкретную важную для…
- #5385🔬 Метод В оригинальной работе метод был из себя весь такой замечательный, но…
🔬 Метод В оригинальной работе метод был из себя весь такой замечательный, но замерялся на сравнительно простых задачах, без интеграций с эффективными…
- #5384A First Comprehensive Study of TurboQuant: Accuracy and Performance [Блог]…
A First Comprehensive Study of TurboQuant: Accuracy and Performance [Блог] Казалось бы, уже стоило бы забить на этот несчастный TurboQuant, но кому-то он все…