Microsoft опенсорснули проект SkillOpt для оптимизации способностей агентов Это фреймворк, который фоново улучшает вашего агента через изменение markdown файлов со скиллами. Это похоже на классический learning loop, но в текстовом пространстве. То есть агент выполняет задачи с текущей версией условного skill.md (это аналог прямого прохода), система легирует все, что тот делает, отмечает ошибки и успешные ответы, а затем на основе этого предлагает небольшие правки в skill (это уже backward pass). Новая версия md принимается только после прохождения верификации на отдельном сете задач (его можно задать самостоятельно или взять готовый). Как и в реальном обучении, тут предусмотрено подобие learning rate: чтобы сразу случайно сильно не испортить файл правками, они могут быть только небольшими и должны соответствовать определенным правилам. Так что попробовать инструмент можно довольно безопасно, даже если боитесь за свои md-шки. Приросты можно посмотреть в большой таблице наверху. Как видите, абсолютно во всех комбинациях моделей и бенчмарков они положительные и заметные, а в Codex и Claude Code на GPT-5.5 средний gain указан вообще как +21.8 и +18.6 соответственно (!). Статья, код, овервью и инструкции по использованию – все здесь: https://microsoft.github.io/SkillOpt/