"Невидимая рука рынка для AGI: Безопасность через экономику Distributional AGI… — @gonzo_ML

"Невидимая рука рынка для AGI: Безопасность через экономику Distributional AGI Safety __Nenad Tomašev, Matija Franklin, Julian Jacobs, Sébastien Krier, Simon Osindero__ Статья: https://arxiv.org/abs/2512.16856 Ревью: https://arxiviq.substack.com/p/distributional-agi-safety # TL;DR ЧТО сделали: Авторы предлагают фреймворк ""Distributional AGI Safety"", смещающий фокус с выравнивания (alignment) отдельных моделей на управление взаимодействиями в мультиагентных системах. Вводится концепция Virtual Agentic Sandbox Economy (Виртуальная агентная песочница-экономика) — архитектура глубокоэшелонированной защиты. Безопасность здесь обеспечивается рыночными механизмами (налоги на транзакции, криптографически подтверждённая идентичность, автоматические предохранители), а не только надеждой на ""правильные"" веса внутри одной нейросети. ПОЧЕМУ это важно: Текущие парадигмы безопасности в основном готовятся к появлению монолитного AGI (одной гигантской модели). Эта работа аргументирует в пользу гипотезы ""Patchwork AGI"" (Лоскутный AGI): общий интеллект возникает из сети специализированных агентов, каждый из которых по отдельности не является AGI. Это меняет правила игры: стандартные методы вроде RLHF не могут предотвратить эмерджентные коллективные патологии — например, неявный сговор или биржевые крахи (flash crashes). Безопасность AGI становится задачей экономического дизайна и системного управления, а не просто психологией одиночного сверхразума. Подробнее: https://t.me/gonzo_ML_podcasts/1833"

Из этого канала