Земля более не будет вращаться под ногами лишь одного солипсиста Иванова. Теперь все солипсисты будут вращать её одновременно! Вообще потенциально большая тема имхо. Solaris: Building a Multiplayer Video World Model in Minecraft __Georgy Savva, Oscar Michel, Daohan Lu, Suppakit Waiwitlikhit, Timothy Meehan, Dhairya Mishra, Srivats Poddar, Jack Lu, Saining Xie__ Статья: https://arxiv.org/abs/2602.22208 Код: https://github.com/solaris-wm/solaris Модель: https://huggingface.co/collections/nyu-visionx/solaris-models Ревью: https://arxiviq.substack.com/p/solaris-building-a-multiplayer-video # TL;DR ЧТО сделали: Исследователи из Нью-Йоркского университета разработали Solaris — многоагентную видеомодель мира, способную симулировать согласованные наблюдения с разных ракурсов для нескольких взаимодействующих игроков в Minecraft. Для этого они написали жёстко контролируемый движок оркестрации данных (SolarisEngine), который позволил собрать 12.64 млн синхронизированных мультиплеерных кадров. Авторы модифицировали архитектуру для расшаривания пространственно-временного внимания между агентами и предложили алгоритм Checkpointed Self Forcing для стабильного и эффективного по памяти обучения на длинных горизонтах. ПОЧЕМУ это важно: Текущие видеомодели мира по своей природе солипсичны — они моделируют среду только от лица одного агента. Доказав, что единая диффузионная архитектура может поддерживать согласованность перспектив и пространственную память одновременно для нескольких точек зрения, эта работа закладывает структурный фундамент для обучения foundation моделей, способных точно симулировать сложные многоагентные среды. Это критически важный шаг для генерации синтетических данных и многоагентного обучения с подкреплением (RL). Вращать землю тут: https://t.me/gonzo_ML_podcasts/2757
Земля более не будет вращаться под ногами лишь одного солипсиста Иванова.…
Из этого канала
- #4937Интересное интервью с Джереми Ховардом. Много рассуждает на темы, что AI Coding…
Интересное интервью с Джереми Ховардом. Много рассуждает на темы, что AI Coding != AI Software Engineering.
- #4938"Theory of Code Space: Do Code Agents Understand Software Architecture?…
"Theory of Code Space: Do Code Agents Understand Software Architecture? Зацепила тут одна тема, не удержался и дошёл до статьи.
- #4939"В коде есть штука, которой нет в пространственных средах (ну или она там не…
"В коде есть штука, которой нет в пространственных средах (ну или она там не так важна, хотя в принципе тоже есть) — архитектурный замысел (“туда не ходи, сюда…
- #4930Свежего Пенроуза вам в ленту. С Тегмарком. К Пенроузу можно относиться…
Свежего Пенроуза вам в ленту. С Тегмарком. К Пенроузу можно относиться по-разному, но как пища для ума он точно хорош.
- #4925Очередная работа про агентов для написания эффективных CUDA ядер. На этот раз…
Очередная работа про агентов для написания эффективных CUDA ядер. На этот раз от китайцев.