"Новости с полей про разворачивание системы с встроенным AI+Coding агентов Это продолжение истории, которую я описывал в канале ранее. Оглавление тут. Там нужно было срочно сделать систему извлечения сложных данных из разнообразных промышленных PDF спецификаций. Пару дней назад сделали полный прогон на новых документах от новых компаний, которые добавили в пайплайн (первые шаги пайплайна - это отдельная песня). Пайплайн прожевал их, найдя 41932 сущностей __Напомню, что 400 сущностей для тестового набора данных извлекала команда в течение пары недель в сумме.__ __Можете представить себе экономию времени.__ В процессе система отчиталась, что AI Coding agent сгенерировал 2515 инструментов в 372668 строчек кода общим объемом в 15.28MB. В сумме было потрачено $61.62 (такими темпами аккаунт не скоро выйдет на новый Tier). Точность извлечения на тестовых (самых сложных) данных: 84.8%, что выше требований клиента. Причем, слабое место пайплайна видно глазами - категория документов и полей в документе (смотрите на большую красную секцию на карте ошибок в комментариях - это китайские поставщики, в их документах доменная модель очень сильно отличается в ряде моментов). Можно над этим работать дальше или просто учитывать при использовании результатов. Про этот проект я рассказывал подробнее на KanDDDinsky. Видео пока не выложили, слайды и ссылки к докладу лежат тут. Директора очень довольны получившейся архитектурой (дословно ""Because we can!""), особенно тем фактом, что этот код не видел ни один человек, да и не увидит. При новых прогонах - просто перегенерируем заново. Но на самом деле активное использование системы для кодинга внутри LLM-пайплайна - это просто оптимизация скорости и стоимости, которая стала возможной благодаря наличию тестов и цикла быстрой оценки качества. Ваш, @llm_under_hood 🤗"
"Новости с полей про разворачивание системы с встроенным AI+Coding агентов Это…
Из этого канала
- #684"Вставляет ли OpenAI ""втихую"" JSON схему в каждый запрос со Structured…
"Вставляет ли OpenAI ""втихую"" JSON схему в каждый запрос со Structured Outputs? Принципиально важно это для двух вещей: (1) инженерного подхода к построению…
- #685"Я сегодня закончил первый прототип платформы для ERC3: Enterprise AI Agents.…
"Я сегодня закончил первый прототип платформы для ERC3: Enterprise AI Agents. Получается довольно симпатично, сейчас все расскажу.
- #686В Gemini 2.5 завезли нормальные Structured Outputs! Поддержку для JSON Schema…
В Gemini 2.5 завезли нормальные Structured Outputs! Поддержку для JSON Schema добавили в Google во все поддерживаемые модели Gemini (в старые версии - с…
- #682Заметки на полях по итогам KanDDDinsky Напомню, что KanDDDinsky - это ежегодная…
Заметки на полях по итогам KanDDDinsky Напомню, что KanDDDinsky - это ежегодная конференция в Берлине, которую организовывает Marco Heimeshoff.
- #681Знаковый слайд. Но не потому, что Eric Evans (автор DDD) рассказывает про…
Знаковый слайд. Но не потому, что Eric Evans (автор DDD) рассказывает про базовые вещи DDD+AI с учетом перспектив и наработок, которые мы сделали в нашем…