"Agents of Change: Self-Evolving LLM Agents for Strategic Planning Исследователи взяли стратегическую игру с неполной информацией, элементами случайности, необходимостью управлять ресурсами и вести переговоры. Они сделали proof-of-concept системы, где агент сам улучшает код, управляющий его решениями, и, что особенно круто, самостоятельно улучшает его prompt. На этом игровом примере показали, как итерационная рефлексия для улучшения кода и промптов заметно повышает результаты агента в игре. Мне кажется, ровно в эту сторону будут двигаться и промышленные AI системы. Уже сейчас разработчики-люди вручную прогоняют историю действий и результатов свой ai агентов, чтобы ai улучшал код и промпт агента. Логичный следующий шаг – полностью замкнутый цикл самоулучшения. А особенно весело будет, когда ""рефлексирующий"" агент сможет редактировать не только ""действующего"" агента, но и самого себя, рекурсивно 🙈😍 Статья: https://arxiv.org/abs/2506.04651 Видео-обзор: https://www.youtube.com/watch?v=1WNzPFtPEQs @vsevolodustinovchannel"
"Agents of Change: Self-Evolving LLM Agents for Strategic Planning…
Источник
https://t.me/vsevolodustinovchannel/2562Канал Всеволод Устинов (канал: ai, стартапы, пост-ирония) · опубликовано 14 июн. 2025 г.
Из этого канала
- #2563Wooooowww! Music as a code! Артист:…
Wooooowww! Music as a code! Артист: https://open.spotify.com/artist/78ZgfyDjF59qBIWrGHRdme Инструмент: https://strudel.cc/ @vsevolodustinovchannel
- #2564— Папа, что такое Убер? — Это как Веймо, только с водителем
— Папа, что такое Убер? — Это как Веймо, только с водителем
- #2567"Есть вайб-кодинг. А теперь будет вайб-маркетинг. В частности —…
"Есть вайб-кодинг. А теперь будет вайб-маркетинг. В частности — вайб-перформанс-маркетинг.
- #2560Anthropic выложил разбор того, как они делали своего агента - исследователя для…
Anthropic выложил разбор того, как они делали своего агента - исследователя для Claude.
- #2559Крутая статья по внутреннее устройство deep research агентов Anthropic. Хорошее…
Крутая статья по внутреннее устройство deep research агентов Anthropic. Хорошее саммари, но оригинал тоже не слишком длинный - рекомендую