Дайджест статей 📰 RAG в enterprise: 70-80% проблем не в модели, а в данных 🔗… — @cdo_club

Дайджест статей 📰 RAG в enterprise: 70-80% проблем не в модели, а в данных 🔗 https://habr.com/ru/companies/alpinadigital/articles/1036196/ Из 12 000 «актуальных» документов после аудита осталось 3 800 — выбросили три четверти, и retrieval вырос кратно без единой строчки кода. 💡 Вывод: бюджет первого месяца RAG-проекта закладывать на аудит и чистку данных, а не на модель и железо; ранний индикатор гнилой базы — доля документов, не обновлявшихся больше года. 📰 «Особое мнение» по каждому SKU: три AI-модели вместо BI-правил 🔗 https://habr.com/ru/articles/1036774/ Rule-based вердикт («возвраты >15% → флаг») врёт тем сильнее, чем разнороднее рынок, и его заменили консилиумом из трёх LLM с арбитратором — но аномалии всё равно ловят правилами на голом SQL. 💡 Вывод: разводить детектирование (дёшево, правила, real-time) и интерпретацию (дорого, модели, батч) — не гонять дорогой консилиум там, где аномалию увидит SQL-детектор. 📰 Что такое DWH (КХД) и как работает корпоративное хранилище данных 🔗 https://habr.com/ru/articles/1037496/ Базовый, но системный разбор: трёхуровневая модель и LSA, Кимбалл vs Инмон vs Data Vault, ETL/ELT, отличия от БД и Data Lake, типовые провалы внедрения. 💡 Вывод: выбор методологии моделирования — это бизнес-решение про сроки и стоимость эволюции, а не техническое; без Data Governance хранилище превращается в «свалку данных» и нагрузку для ИТ, а не в актив. 📰 RAG для тех, кто разочаровался: почему retrieval ломается и как это починить 🔗 https://habr.com/ru/companies/otus/articles/1034386/ Слабое звено — не модель, а retrieval; четыре рычага (нарезка по структуре, гибрид вектор+BM25, reranking, eval dataset), каждый внедряется за день. 💡 Вывод: сначала собрать eval dataset (50–100 пар «вопрос → нужный чанк») — без него любая правка чанкинга или эмбеддингов это гадание, а не инженерия. 📰 Как мы построили корпоративную LLM-платформу: архитектура, грабли и выводы 🔗 https://habr.com/ru/companies/sminex_developer/articles/1037438/ Пошли в платформу, а не в «одного бота»: единый gateway (LiteLLM), наблюдаемость (Langfuse), RBAC/SSO. Тезис, к которому возвращаются: главный риск корпоративного AI — управляемость внедрения, а не качество модели. 💡 Вывод: gateway + observability + доступы строить ДО кейсов; экономика платформы = экономика кейса — первый ассистент дорогой, пятый дешёвый, а «зоопарк ботов» с отдельными ключами это техдолг с первого дня. 📰 From Data Movement to Local Intelligence: The Shift 🔗 https://dzone.com/articles/from-data-movement-to-local-intelligence-the-shift Сдвиг от централизованного AI (данные едут к модели) к федеративному (модель едет к данным, наружу уходят только апдейты). Меняется и природа контроля: вопрос «кто имеет доступ к данным» становится вопросом «что AI разрешено с ними делать». 💡 Вывод: там, где данные распределены, чувствительны и зажаты регуляторикой (банки, healthcare, telecom), федерация снимает компромисс «данные vs комплаенс»; governance смещается с доступа к данным на права действий модели.

Из этого канала