Текстовой оптимизации прибыло. SkillOpt: Executive Strategy for Self-Evolving Agent Skills __Yifan Yang, Ziyang Gong, Weiquan Huang, Qihao Yang, Ziwei Zhou, Zisu Huang, Yan Li, Xuemei Gao, Qi Dai, Bei Liu, Kai Qiu, Yuqing Yang, Dongdong Chen, Xue Yang, Chong Luo__ Paper: https://arxiv.org/abs/2605.23904 Review: https://arxiviq.substack.com/p/skillopt-executive-strategy-for-self Code: https://aka.ms/SkillOpt Model: N/A # TL;DR ЧТО сделали: Авторы разработали SkillOpt — систематический и контролируемый оптимизатор в текстовом пространстве. Он рассматривает навыки ИИ-агентов на естественном языке как обучаемое внешнее состояние. Вместо ручного подбора промптов или хаотичной автоматической генерации, SkillOpt структурирует обновления поведения агентов с помощью подходов, вдохновлённых глубоким обучением. Здесь используются текстовые аналоги скорости обучения (бюджеты правок), строгие фильтры валидации, буферы отклонённых правок и медленные мета-обновления на уровне эпох. ПОЧЕМУ это важно: Этот подход обеспечивает высокую стабильность и воспроизводимость офлайн-оптимизации как для замороженных передовых моделей, так и для небольших локальных LLM. Компилируя сложную доменную адаптацию в обычные, понятные человеку markdown-файлы, SkillOpt обеспечивает колоссальный прирост точности (в среднем на +23.5 процентных пункта для GPT-5.5) в задачах на рассуждение, работе с таблицами и управлении агентами. При этом во время инференса не возникает никакой дополнительной задержки или лишних вызовов моделей. Для практиков: Фреймворк позволяет бесплатно переносить высококачественные «навыки», оптимизированные на мощных моделях, на более лёгкие локальные LLM (например, Qwen). Полученные файлы инструкций компактны, легко проверяются человеком и не требуют файнтюнинга весов. Оптимизировать скиллы здесь: https://t.me/gonzo_ML_podcasts/3785
Текстовой оптимизации прибыло. SkillOpt: Executive Strategy for Self-Evolving…
Из этого канала
- #5452Очень интересная работа. Модели осваивают навыки в определённом порядке и он…
Очень интересная работа. Модели осваивают навыки в определённом порядке и он сохраняется между разными моделями.
- #5456Наш любимый Michael Levin написал любопытную статью (он на редкость…
Наш любимый Michael Levin написал любопытную статью (он на редкость продуктивен, пишет много).
- #5464У агентов всё как у людей, кто громче и самоувереннее кричит, того мнение и…
У агентов всё как у людей, кто громче и самоувереннее кричит, того мнение и слушают 😿 Multi-Agent Systems are Mixtures of Experts: Who Becomes an Influencer?…
- #5440Спать хорошо. А высыпаться ещё лучше. Language Models Need Sleep Sangyun Lee,…
Спать хорошо. А высыпаться ещё лучше. Language Models Need Sleep Sangyun Lee, Sean McLeish, Tom Goldstein, Giulia Fanti Paper: https://arxiv.org/abs/2605.26099…
- #5435"Нейросеть как зашумлённый канал передачи информации. LLMs as Noisy Channels:…
"Нейросеть как зашумлённый канал передачи информации. LLMs as Noisy Channels: A Shannon Perspective on Model Capacity and Scaling Laws Xu Ouyang, Deyi Liu,…