"Вчера для deep research брали одного большого агента. Но по пять. А сегодня берут несколько маленьких. Но по три. Memory Intelligence Agent __Jingyang Qiao, Weicheng Meng, Yu Cheng, Zhihang Lin, Zhizhong Zhang, Xin Tan, Jingyu Gong, Kun Shao, Yuan Xie__ Статья: https://arxiv.org/abs/2604.04503v2 Ревью: https://arxiviq.substack.com/p/memory-intelligence-agent Код: https://github.com/ECNU-SII/MIA Модель: https://huggingface.co/LightningCreeper/MIA # TL;DR ЧТО сделали: Авторы предложили фреймворк Memory Intelligence Agent (MIA), который перестраивает ризонинг автономного агента в разделённую архитектуру Manager-Planner-Executor. Подход смещает фокус с простого извлечения фактов на выучивание процедурных стратегий поиска. Это достигается за счёт комбинации явного непараметрического буфера памяти и непрерывного обновления параметров модели через обучение с подкреплением прямо во время инференса (Test-Time Learning, TTL). ПОЧЕМУ это важно: Исследователи эмпирически доказали, что умное управление памятью и стратегическая абстракция способны нивелировать разницу в качестве между маленькими и большими моделями. Использование 7B модели в роли исполнителя позволило превзойти 32B модель на 18%. MIA показывает, что выучивание самого ""процесса"" решения задачи вычислительно эффективнее и лучше масштабируется, чем простое расширение окна контекста или увеличение числа параметров. Для практиков: Современные deep research агенты часто страдают от раздувания памяти и размытия внимания при обработке длинных историй выполнения. MIA решает эту проблему, сжимая сырые трейсы взаимодействия в высокоуровневые саммари рабочих процессов, которые затем используются для динамического обновления агента-планировщика через попеременное обучение с подкреплением. Для архитекторов ИИ-систем это сигнал к переходу на саморазвивающиеся архитектуры, где непрерывное обучение специфичным процедурам прямо на инференсе даёт больший профит, чем статический, перегруженный знаниями контекст. Три агента тут: https://t.me/gonzo_ML_podcasts/3169"
"Вчера для deep research брали одного большого агента. Но по пять. А сегодня…
Из этого канала
- #5164"Большой обзор про латентное пространство! The Latent Space: Foundation,…
"Большой обзор про латентное пространство! The Latent Space: Foundation, Evolution, Mechanism, Ability, and Outlook Xinlei Yu, Zhangquan Chen, Yongbo He,…
- #5171Про будущее математики от Теренса Тао. Также в тему свежая статья из Quanta…
Про будущее математики от Теренса Тао. Также в тему свежая статья из Quanta Magazine: “The AI Revolution in Math Has Arrived” Mathematical methods and human…
- #5173Про многоэтапную верификацию CUA (Computer Use Agent). The Art of Building…
Про многоэтапную верификацию CUA (Computer Use Agent). The Art of Building Verifiers for Computer Use Agents Corby Rosset, Pratyusha Sharma, Andrew Zhao,…
- #5157Вышел свежий 2026 AI Index Report…
Вышел свежий 2026 AI Index Report https://hai.stanford.edu/ai-index/2026-ai-index-report
- #5156Структура свободного времени сильно изменилась за последние месяцы. Теперь есть…
Структура свободного времени сильно изменилась за последние месяцы. Теперь есть миллион проектов, которые наконец можно не закапывать в списки на будущее, а…