"Невидимая рука рынка для AGI: Безопасность через экономику Distributional AGI Safety __Nenad Tomašev, Matija Franklin, Julian Jacobs, Sébastien Krier, Simon Osindero__ Статья: https://arxiv.org/abs/2512.16856 Ревью: https://arxiviq.substack.com/p/distributional-agi-safety # TL;DR ЧТО сделали: Авторы предлагают фреймворк ""Distributional AGI Safety"", смещающий фокус с выравнивания (alignment) отдельных моделей на управление взаимодействиями в мультиагентных системах. Вводится концепция Virtual Agentic Sandbox Economy (Виртуальная агентная песочница-экономика) — архитектура глубокоэшелонированной защиты. Безопасность здесь обеспечивается рыночными механизмами (налоги на транзакции, криптографически подтверждённая идентичность, автоматические предохранители), а не только надеждой на ""правильные"" веса внутри одной нейросети. ПОЧЕМУ это важно: Текущие парадигмы безопасности в основном готовятся к появлению монолитного AGI (одной гигантской модели). Эта работа аргументирует в пользу гипотезы ""Patchwork AGI"" (Лоскутный AGI): общий интеллект возникает из сети специализированных агентов, каждый из которых по отдельности не является AGI. Это меняет правила игры: стандартные методы вроде RLHF не могут предотвратить эмерджентные коллективные патологии — например, неявный сговор или биржевые крахи (flash crashes). Безопасность AGI становится задачей экономического дизайна и системного управления, а не просто психологией одиночного сверхразума. Подробнее: https://t.me/gonzo_ML_podcasts/1833"
"Невидимая рука рынка для AGI: Безопасность через экономику Distributional AGI…
Из этого канала
- #4464Ещё один способ не тренировать новый тип модели с нуля, а адаптировать…
Ещё один способ не тренировать новый тип модели с нуля, а адаптировать предобученную.
- #4468Даёшь иерархию в авторегрессии! PHOTON: Hierarchical Autoregressive Modeling…
Даёшь иерархию в авторегрессии! PHOTON: Hierarchical Autoregressive Modeling for Lightspeed and Memory-Efficient Language Generation Yuma Ichikawa, Naoya…
- #4471Дело говорит. https://x.com/karpathy/status/2004607146781278521?s=20
Дело говорит. https://x.com/karpathy/status/2004607146781278521?s=20
- #4459Интересно как... Today, Groq announced that it has entered into a non-exclusive…
Интересно как... Today, Groq announced that it has entered into a non-exclusive licensing agreement with Nvidia for Groq’s inference technology.
- #4455"Монстрический Tri Dao (соавтор Мамбы) и его группа снова делает хардкорные…
"Монстрический Tri Dao (соавтор Мамбы) и его группа снова делает хардкорные инженерные вещи, теперь про MoE.