"Agents of Change: Self-Evolving LLM Agents for Strategic Planning Исследователи взяли стратегическую игру с неполной информацией, элементами случайности, необходимостью управлять ресурсами и вести переговоры. Они сделали proof-of-concept системы, где агент сам улучшает код, управляющий его решениями, и, что особенно круто, самостоятельно улучшает его prompt. На этом игровом примере показали, как итерационная рефлексия для улучшения кода и промптов заметно повышает результаты агента в игре. Мне кажется, ровно в эту сторону будут двигаться и промышленные AI системы. Уже сейчас разработчики-люди вручную прогоняют историю действий и результатов свой ai агентов, чтобы ai улучшал код и промпт агента. Логичный следующий шаг – полностью замкнутый цикл самоулучшения. А особенно весело будет, когда ""рефлексирующий"" агент сможет редактировать не только ""действующего"" агента, но и самого себя, рекурсивно 🙈😍 Статья: https://arxiv.org/abs/2506.04651 Видео-обзор: https://www.youtube.com/watch?v=1WNzPFtPEQs @vsevolodustinovchannel"