Фей-Фей Ли хвастается world model своего стартапа — World Labs Для генерации всего мира понадобилась всего лишь одна картинка, причём по видео видно что консистентность на высоте — модель не забывает детали локации как только пользователь отвернулся. Ну и длина генерации не ограничена. Все потому что это не традиционная генерация, основанная на видео диффузии (как Genie 3 или Gamecraft), а на гаусовских сплатах (пост с объяснением). @ai_newz