Наука скейлинга агентов. Towards a Science of Scaling Agent Systems __Yubin Kim, Ken Gu, Chanwoo Park, Chunjong Park, Samuel Schmidgall, A. Ali Heydari, Yao Yan, Zhihan Zhang, Yuchen Zhuang, Mark Malhotra, Paul Pu Liang, Hae Won Park, Yuzhe Yang, Xuhai Xu, Yilun Du, Shwetak Patel, Tim Althoff, Daniel McDuff, and Xin Liu__ Статья: https://arxiv.org/abs/2512.08296 Ревью: https://arxiviq.substack.com/p/towards-a-science-of-scaling-agent # TL;DR ЧТО сделали: Авторы провели масштабное контролируемое исследование 180 конфигураций агентных систем, варьируя возможности моделей (семейства OpenAI, Google, Anthropic), топологию координации и свойства задач. На основе этого вывели количественный «закон масштабирования» для мультиагентных систем (MAS). Этот закон предсказывает итоговую производительность на основе метрик взаимодействия, ставя под сомнение популярное мнение, что простое увеличение числа агентов всегда ведет к улучшению результата. ПОЧЕМУ это важно: Работа доказывает, что эффективность MAS зависит не от линейного масштабирования, а от компромисса между выгодой от распараллеливания и накладными расходами на координацию. Исследователи выявили конкретные «режимы отказа» — в частности, задачи с интенсивным использованием инструментов и последовательной логикой — где добавление агентов ухудшает результат вплоть до 70%. Предложен предиктивный фреймворк (R^2=0.513), помогающий определить, когда стоит разворачивать сложный рой, а когда лучше справится одна сильная модель. Подробнее: https://t.me/gonzo_ML_podcasts/1693
Наука скейлинга агентов. Towards a Science of Scaling Agent Systems Yubin Kim,…
Из этого канала
- #4369"Сегодня супердлинный жанр. Computational Life: How Well-formed,…
"Сегодня супердлинный жанр. Computational Life: How Well-formed, Self-replicating Programs Emerge from Simple Interaction Blaise Agüera y Arcas, Jyrki…
- #4370Эксперименты начинаются со всеми любимого брейнфака (кстати, не знал, что есть…
Эксперименты начинаются со всеми любимого брейнфака (кстати, не знал, что есть такой прекрасный вариант упоминания как “bfuck”).
- #4371В доисторический период (до перехода) большинство само-модификаций происходят…
В доисторический период (до перехода) большинство само-модификаций происходят на концах ленты с редкими мутациями в середине.
- #4364И для разнообразия про другие Gemini. В эти выходные максимум метеорного потока…
И для разнообразия про другие Gemini. В эти выходные максимум метеорного потока Геминиды:…
- #4361Забавная работа, обучаем модели специальному языку для ризонинга. ORION:…
Забавная работа, обучаем модели специальному языку для ризонинга. ORION: Teaching Language Models to Reason Efficiently in the Language of Thought Kumar…