Про свою работу о Гиперагентах Таня уже написала, но не пропадать же картинке! HyperAgents __Jenny Zhang, Bingchen Zhao, Wannan Yang, Jakob Foerster, Jeff Clune, Minqi Jiang, Sam Devlin, Tatiana Shavrina__ Статья: https://arxiv.org/abs/2603.19461 Код: https://github.com/facebookresearch/Hyperagents Ревью: https://arxiviq.substack.com/p/hyperagents # TL;DR ЧТО сделали: Авторы представили DGM-Hyperagents (DGM-H) — фреймворк, который объединяет агента, решающего задачу, и метаоптимизирующего агента в единую, полностью редактируемую самореферентную программу. Погрузив эту сущность в open-ended эволюционный поиск, система автономно переписывает как логику выполнения задачи, так и собственные внутренние механизмы самосовершенствования. ПОЧЕМУ это важно: Предыдущие самообучающиеся системы упирались в созданные людьми алгоритмы метаобучения, которые плохо обобщаются на новые домены. DGM-H показывает, что агент может самостоятельно изобретать переносимые методы оптимизации (например, системы постоянной памяти и автоматическое выявление смещений). Это позволяет накапливать улучшения и метанавыки в совершенно разных областях, таких как дизайн ревордов для робототехники или проверка олимпиадных задач по математике. Для практиков: Для тех, кто занимается AI alignment и open-endedness, эта статья от FAIR и академических соавторов даёт схему систем, которые не просто лучше решают задачу, а становятся лучше в самом процессе улучшения. Делая механизм метаобучения программируемым и редактируемым самим агентом, авторы обходят необходимость ручного дизайна эвристик для конкретных доменов. Это открывает надёжный путь к архитектурам с самоускоряющейся оптимизацией. Гиперагенты тут: https://t.me/gonzo_ML_podcasts/2924
Про свою работу о Гиперагентах Таня уже написала, но не пропадать же картинке!…
Из этого канала
- #5045"Всё больше работ про непрерывную адаптацию агентов в проде. Было извлечение…
"Всё больше работ про непрерывную адаптацию агентов в проде. Было извлечение реворда из текущих взаимодействий с OpenClaw-RL. Будет завтра про Memento-Skills.
- #5050Продолжаем тему с постоянной адаптацией агентов. Сегодня обещанная эволюция…
Продолжаем тему с постоянной адаптацией агентов. Сегодня обещанная эволюция скиллов.
- #5055Будем почитать
Будем почитать
- #5037Лекун и ко предлагают архитектуру для автономного ИИ с тремя системами A, B, М.…
Лекун и ко предлагают архитектуру для автономного ИИ с тремя системами A, B, М. Why AI systems don't learn and what to do about it: Lessons on autonomous…
- #5036Безопасно ли это? Совершенно нет! Но весело Можно добавлять метрики и бенчмарки…
Безопасно ли это? Совершенно нет! Но весело Можно добавлять метрики и бенчмарки AI Safety прямо в multi-task objective, чтобы агент оптимизировался исходя из…