Вот такой вот пайплайн вырисовывается в системе для миграции легаси ERP системы без тестов на современный стэк (описание кейса). Если точнее, это выглядит как агентский пайплайн для написания тестов на основе работающего кода и ручного поиска багов. А уж переписанный код - это побочный эффект. В основе - набор из 5-х паттернов: (1) RAG - нарезаем исходный код на логические блоги и выстраиваем взаимосвязи между ними. Это позволит потом “хирургически точно” наполнять контекст для разных задач. (2) Workflow - используем несколько прописанных заранее процессов, которые пошагово анализируют код, выявляют пропущенные требования (gaps), составляют планы по реализации и выполняют их. (3) AI+Code Memory (новый паттерн, cм тут) - агенты могут оставлять друг другу заметки и комментарии, которые по определенным правилам ссылаются на другие файлы и старый код. (4) REPL / Feedback Loop - основной автоматический процесс, который пополняет набор тестов и поправляет код до полного прохождения всех тестов. (5) Human in the loop - человеческий пригляд используется для корректирования всей этой системы, чтобы качество тестов и кода постепенно росло. Качество - это траектория. Ощущение от работы всей этой системы на текущих этапах непередаваемые. Словно управляешь небольшим автоматизированным заводом. Ваш, @llm_under_hood 🤗 PS: Это не полностью автоматизированная система. Пока приходится много однообразно кликать мышкой и копи-пастить между окнами. Если проект взлетит - автоматизируем полностью.
Вот такой вот пайплайн вырисовывается в системе для миграции легаси ERP системы…
Из этого канала
- #615Кейс про миграцию сотни старых MS Access файлов Ринат, а ты можешь показать,…
Кейс про миграцию сотни старых MS Access файлов Ринат, а ты можешь показать, как полу-автоматически перетащить сотни дремучих и разнообразных MS Access баз на…
- #616Очень хочется делиться мелкими фишками про AI+Coding, которые нахожу в процессе…
Очень хочется делиться мелкими фишками про AI+Coding, которые нахожу в процессе активного использования на проектах.
- #617"График точности всех RAG экспериментов из ERCv2 Напомню, что в Enterprise RAG…
"График точности всех RAG экспериментов из ERCv2 Напомню, что в Enterprise RAG Challenge 43 команды ставили эксперименты по построению RAG систем, которые…
- #613Качество - это траектория Недавно мы подкручивали промпт в нашем проекте.…
Качество - это траектория Недавно мы подкручивали промпт в нашем проекте. После изменений система стала работать лучше, но пользователи начали жаловаться.
- #612Что думают про перспективы продуктов с LLM под капотом в крупнейшей в мире…
Что думают про перспективы продуктов с LLM под капотом в крупнейшей в мире консалтинговой компании? Я задал такой вопрос представителям Deloitte.