"Симбиогенез в массы! С одной стороны, прикольная библиотека для всего в одном месте. С другой стороны, интересный результат про количественную оценку ""коллаборативной эмерджентности"" — система из моделей решает задачи, неподвластные любой отдельной модели. MOCO: A One-Stop Shop for Model Collaboration Research __Shangbin Feng, Yuyang Bai, Ziyuan Yang, Yike Wang, Zhaoxuan Tan, Jiajie Yan, Zhenyu Lei, Wenxuan Ding, Weijia Shi, Haojin Wang, Zhenting Qi, Yuru Jiang, Heng Wang, Chengsong Huang, Yu Fei, Jihan Yao, Yilun Du, Luke Zettlemoyer, Yejin Choi, Yulia Tsvetkov__ Статья: https://arxiv.org/abs/2601.21257 Ревью: https://arxiviq.substack.com/p/moco-a-one-stop-shop-for-model-collaboration Код: https://github.com/BunsenFeng/model_collaboration # TL;DR ЧТО сделали: Представили MOCO — унифицированную библиотеку на Python, которая реализует и бенчмаркает 26 алгоритмов коллаборации моделей. Методы охватывают четыре уровня обмена информацией: от роутинга API и текстовых дебатов до слияния логитов и весов. Всё это проверили на 25 датасетах, включая задачи на рассуждение, написание кода и проверку безопасности. ПОЧЕМУ это важно: Индустрия уходит от гигантских монолитов к композитным системам экспертов, но исследования в этой области были фрагментированы. MOCO предлагает строгий фреймворк для сравнения методов. Ключевой результат — количественная оценка ""коллаборативной эмерджентности"": системы могут решать примерно 18.5% задач, с которыми не справилась ни одна составляющая модель по отдельности. Подробнее: https://t.me/gonzo_ML_podcasts/2359"
"Симбиогенез в массы! С одной стороны, прикольная библиотека для всего в одном…
Из этого канала
- #4744"Ещё один обзор про память агентов. Другой обзор был в декабре…
"Ещё один обзор про память агентов. Другой обзор был в декабре (https://t.me/gonzoML/4415), тоже от китайской команды.
- #4748"Работа про осмысление подходов с моделями мира. Кстати, в тему. После интервью…
"Работа про осмысление подходов с моделями мира. Кстати, в тему. После интервью с Постнаукой (текстовый вариант тут, но там всё-таки больше саммари), отдельно…
- #4751Зачётная работа про inductive biases для физики. From Kepler to Newton:…
Зачётная работа про inductive biases для физики. From Kepler to Newton: Inductive Biases Guide Learned World Models in Transformers Ziming Liu, Sophia Sanborn,…
- #4733Интересная работа, при этом мне кажется очень полезная для large-scale…
Интересная работа, при этом мне кажется очень полезная для large-scale оптимизации и ускорения исследований.
- #4731🗣 Speech / Multimodality 27. Deep Speech 2: End-to-End Speech Recognition in…
🗣 Speech / Multimodality 27. Deep Speech 2: End-to-End Speech Recognition in English and Mandarin (https://arxiv.org/abs/1512.02595 ) — Amodei et al., 2016 —…