Самообучающиеся агенты Запилил вчера на хакатоне такую штуку: слек-бот, который обучается на том, как его исправляет человек, и другим ботам передает это знание, если оно им релевантно. Например, у вас сейлз бот и он помогает вам отвечать на запросы клиентов, но иногда он выдает слишком длинное сообщение, или напридумывает всякого. Вы просто отвечаете клиенту так, как вы хотите, а система учится и учит ботов других клиентов или других ботов - саппорт, например - этого же. Такая вертикальная и горизонтальная эволюция. Причем я решил не делать сложные reinforcement learning и тп, а просто динамическая подправка правил в промптах. Так, по моему мнению, выходит проще, понятнее (можно обьяснить правила, проаудировать их) и гораздо быстрее. Без ретрейнинга модели и privacy проблем Ничего не выиграл, к сожалению, но запилил, что хотел и будем точно встраивать в продакшн. Назыму особое спасибо за видео!