"Больше моделей мира за пределами красивых картинок! Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond __Meng Chu, Xuan Billy Zhang, Kevin Qinghong Lin, Lingdong Kong, Jize Zhang, Teng Tu, Weijian Ma, Ziqi Huang, Senqiao Yang, Wei Huang, Yeying Jin, Zhefan Rao, Jinhui Ye, Xinyu Lin, Xichen Zhang, Qisheng Hu, Shuai Yang, Leyang Shen, Wei Chow, Yifei Dong, Fengyi Wu, Quanyu Long, Bin Xia, Shaozuo Yu, Mingkang Zhu, Wenhu Zhang, Jiehui Huang, Haokun Gui, Haoxuan Che, Long Chen, Qifeng Chen, Wenxuan Zhang, Wenya Wang, Xiaojuan Qi, Yang Deng, Yanwei Li, Mike Zheng Shou, Zhi-Qi Cheng, See-Kiong Ng, Ziwei Liu, Philip Torr, Jiaya Jia__ Paper: https://arxiv.org/abs/2604.22748 Code: https://github.com/matrix-agent/awesome-agentic-world-modeling Review: https://arxiviq.substack.com/p/agentic-world-modeling-foundations # TL;DR ЧТО сделали: Авторы проанализировали более 400 работ и предложили унифицированную двумерную классификацию моделей мира (уровни × законы). Выделено три иерархических уровня способностей: L1 Предсказатель (одношаговые локальные переходы), L2 Симулятор (многошаговые роллауты с соблюдением ограничений среды) и L3 Эволюционер (автономное обновление модели на основе собранных улик). Эта архитектура пересекается с четырьмя типами законов (физические, цифровые, социальные, научные), которые задают правила для симулируемой среды. ПОЧЕМУ это важно: Термин ""модель мира"" (world model) стал слишком размытым — часто под ним ошибочно понимают просто качественную генерацию видео. Строгое определение границ на основе чувствительности к вмешательствам, когерентности на длинных горизонтах и способности к автономному обновлению дает сообществу четкий диагностический инструмент. Фокус смещается с визуального реализма на активное уточнение внутренних законов, прокладывая путь к по-настоящему автономным агентам. Для практиков: Предложен фреймворк оценки MREP (Minimal Reproducible Evaluation Package), который призывает отказаться от визуальных метрик вроде FVD в пользу метрик, ориентированных на принятие решений (Action Success Rate, Counterfactual Outcome Deviation). Теперь успех измеряется тем, насколько модель полезна для планирования, а не тем, насколько красиво она рисует пиксели. Моделировать мир тут: https://t.me/gonzo_ML_podcasts/3436"
"Больше моделей мира за пределами красивых картинок! Agentic World Modeling:…
Из этого канала
- #5300"Про природу минибатчевого SGD. SGD at the Edge of Stability: The Stochastic…
"Про природу минибатчевого SGD. SGD at the Edge of Stability: The Stochastic Sharpness Gap Fangshuo Liao, Afroditi Kolomvaki, Anastasios Kyrillidis Статья:…
- #5303И снова Universal/Looped Transformers. На этот раз для генерации изображений.…
И снова Universal/Looped Transformers. На этот раз для генерации изображений. Один из главных selling point, что модель целиком вмещается в кеш ускорителя, не…
- #5309Готовлю обновление своей статьи, получил интересную картинку, подтверждающую,…
Готовлю обновление своей статьи, получил интересную картинку, подтверждающую, что UT с памятью обменивает размер памяти на количество итераций.
- #5289Ещё в тему про Universal Transformer (https://t.me/gonzoML/5270). Здесь…
Ещё в тему про Universal Transformer (https://t.me/gonzoML/5270). Здесь улучшили способности UT через матричные residual connections (mHC от дипсика, про…
- #5284Красивая история про квантизацию. Как сделать INT4, который нормально работает…
Красивая история про квантизацию. Как сделать INT4, который нормально работает на текущем железе.