Эволюцию скиллов подвезли. SkillClaw: Let Skills Evolve Collectively with Agentic Evolver __Ziyu Ma, Shidong Yang, Yuxiang Ji, Xucong Wang, Yong Wang, Yiming Hu, Tongwen Huang, Xiangxiang Chu__ Статья: https://arxiv.org/abs/2604.08377 Код: https://github.com/AMAP-ML/SkillClaw Ревью: https://arxiviq.substack.com/p/skillclaw-let-skills-evolve-collectively # TL;DR ЧТО сделали: Авторы предложили фреймворк SkillClaw, который переводит LLM-агентов от использования жёстко заданных статических навыков к динамическим, самосовершенствующимся экосистемам. Система собирает логи выполнения от разных пользователей и использует автономного «агентного эволюционера» (agentic evolver) для итеративного улучшения или создания процедур в общей централизованной базе. ПОЧЕМУ это важно: Современные агенты страдают от фрагментированного обучения: разные инстансы раз за разом спотыкаются об одни и те же краевые случаи. Формализация цикла сбора коллективных данных, открытого рассуждения и эмпирической валидации позволяет системе монотонно накапливать процедурный интеллект, не требуя ручного промпт-инжиниринга. Для практиков: Подход даёт возможность агентам самостоятельно исправлять баги в логике своих инструментов в фоновом режиме. Главные трейд-оффы — существенно возросший расход токенов на регулярную симуляцию проверок и необходимость жёсткого контроля за тем, чтобы приватные данные пользователей не утекли в общий системный код навыка. Эволюционировать тут: https://t.me/gonzo_ML_podcasts/3618
Эволюцию скиллов подвезли. SkillClaw: Let Skills Evolve Collectively with…
Из этого канала
- #5377"Этой работе уже год, но мы её не разбирали, а она неожиданно выстрелила в этом…
"Этой работе уже год, но мы её не разбирали, а она неожиданно выстрелила в этом году перед ICLR.
- #5383В дополнение
В дополнение
- #5384A First Comprehensive Study of TurboQuant: Accuracy and Performance [Блог]…
A First Comprehensive Study of TurboQuant: Accuracy and Performance [Блог] Казалось бы, уже стоило бы забить на этот несчастный TurboQuant, но кому-то он все…
- #5366Слаб наш алайнмент! A Single Neuron Is Sufficient to Bypass Safety Alignment in…
Слаб наш алайнмент! A Single Neuron Is Sufficient to Bypass Safety Alignment in Large Language Models Hamid Kazemi, Atoosa Chegini, Maria Safi Статья:…
- #5360И снова BLT, но теперь быстрый! Fast Byte Latent Transformer Julie Kallini,…
И снова BLT, но теперь быстрый! Fast Byte Latent Transformer Julie Kallini, Artidoro Pagnoni, Tomasz Limisiewicz, Gargi Ghosh, Luke Zettlemoyer, Christopher…