Seoul World Model — это прикольно! Grounding World Simulation Models in a Real-World Metropolis __Junyoung Seo, Hyunwook Choi, Minkyung Kwon, Jinhyeok Choi, Siyoon Jin, Gayoung Lee, Junho Kim, JoungBin Lee, Geonmo Gu, Dongyoon Han, Sangdoo Yun, Seungryong Kim, and Jin-Hwa Kim__ Paper: https://arxiv.org/abs/2603.15583v1 Code: https://seoul-world-model.github.io Ревью: https://arxiviq.substack.com/p/grounding-world-simulation-models # TL;DR ЧТО сделали: Представили Seoul World Model (SWM) — систему генерации видео масштаба целого города на 2 миллиарда параметров. В основе лежит Diffusion Transformer (DiT), который использует геоиндексированный поиск для привязки авторегрессионной генерации видео к реальным панорамам улиц Сеула, а не выдумывает окружение с нуля. ПОЧЕМУ это важно: Существующие генеративные мировые модели не умеют сохранять географическую и топологическую достоверность на длинных временных горизонтах: стоит камере завернуть за угол, как модель начинает галлюцинировать новую улицу. Привязывая генерацию к реальным пространственным данным через RAG (retrieval-augmented generation), SWM перекидывает мост между статичными 3D-реконструкциями городов и динамической видеосимуляцией. Это даёт структурную базу для визуализаций в урбанистике и надёжной симуляции граничных случаев для беспилотных авто. Для практиков: Эта работа знаменует важный переход от чисто параметрических, галлюцинирующих мировых моделей к физически обоснованным «цифровым двойникам». Исследователи внедрили механизм динамического извлечения будущих кадров, которые используются как якоря внимания. Это элегантно решает проблему дрейфа на длинных горизонтах, типичную для авторегрессионной генерации, и доказывает, что пространственный RAG — необходимая архитектура для масштабных и стабильных симуляций среды. Кататься по Сеулу тут: https://t.me/gonzo_ML_podcasts/2977
Seoul World Model — это прикольно! Grounding World Simulation Models in a…
Из этого канала
- #5067Интересное обновление MoE от Apple. Обновляем параметры роутера не на каждом…
Интересное обновление MoE от Apple. Обновляем параметры роутера не на каждом слое, а только на каждом блоке из B слоёв.
- #5073"Свежая интересная работа про биологические вычисления. Мы уже упоминали работу…
"Свежая интересная работа про биологические вычисления. Мы уже упоминали работу ""The forest as a neutrino detector"" (https://t.me/gonzoML/2735), текущая…
- #5077"А вот красивая работа. Иногда чтобы хорошо сжать, надо сначала хорошо разжать!…
"А вот красивая работа. Иногда чтобы хорошо сжать, надо сначала хорошо разжать! Сначала дистиллируем всех специализированных учителей в одного БОЛЬШОГО…
- #5060"Статья небольшая, но содержательная (3 страницы текста + 2 ссылок). Такую…
"Статья небольшая, но содержательная (3 страницы текста + 2 ссылок). Такую комментировать и обозревать -- только портить. Так что лучше почитайте оригинал.
- #5056Агенты переписывают описания тулов для других агентов. Всегда было непонятно,…
Агенты переписывают описания тулов для других агентов. Всегда было непонятно, зачем для того, чтобы один компьютер пообщался с другим, нужно столько людей…