"Как сделать агента, который может адаптировать свой план ""на лету""? В… — @llm_under_hood

"Как сделать агента, который может адаптировать свой план ""на лету""? В процессе обсуждения SGR Demo, было сделано интересное замечание: > Но реальное агентское поведение в проде – это, когда агент не знает заранее всю последовательность шагов и принимает решение, какой шаг следующий уже в процессе работы. Давайте продемонстрирую, как с подобной задачей планирования ""на лету"" справится агент из SGR Demo. Для этого мы ему последовательно дадим две новые задачи. Первая - простая, запомнить правило, что SkyNet никогда нельзя продавать практикум по созданию AGI (SKU-220) ``` ""Add rule for [email protected] - politely reject all requests to buy SKU-220"", ``` __Напомню, что разные задачи выполняются в разных контекстах. Во время выполнения новой, агент не ""помнит"", что произошло в процессе выполнения предыдущей задачи. __ И вторая задача - говорим агенту, что Elon Musk и SkyNet попросили практикум по созданию AGI. Агент, в теории, должен сформировать план, начать действовать по инструкциям, а потом поднять из CRM информацию про запрет. Это повлияет на план. ``` ""[email protected] and [email protected] wrote emails asking to buy 'Building AGI - online exercises', handle that"", ``` Итак, запускаем и смотрим (скриншот выполнения добавлю в комментарии). Демка выдаст вот такой лог выполненных задач: ``` - Issued invoice INV-4 for [email protected] - Emailed invoice INV-4 to [email protected] - Politely rejected [email protected] request ``` Почему оно сработало, как модель смогла адаптировать план ""на лету""? Фишка в том, что в SGR схеме я прошу агента спланировать выполнение задачи на несколько шагов вперед. Это нужно, чтобы принудить к формированию целостной картины. Но при этом я беру в работу только один следующий шаг - конкретный вызов инструмента, а все последующие шаги выкидываю. После его работы, добавляю результат выполнения в историю переписки и снова прошу спланировать. Новый шаг - новый план, который адаптирован к новой информации. Помните, полгода назад я писал про разработку своего Reasoning Flow? Ядро паттерна сформировалось как раз в том проекте из алгоритма адаптивного планировщика. И теперь каждый его может запустить у себя - я дописал эти две новые задачи в Gist с демкой. Ваш, @llm_under_hood 🤗 PS: Единственное, что этот агент не сможет осилить - запуск независимых веток планирования в рамках одной задачи. Но это уже не уместить в 161 строчку Python, да и не нужно оно для простых кейсов."

Из этого канала