Дайджест статей 📰 RAG в энтерпрайзе: почему демо работает, а прод нет 🔗 https://habr.com/ru/articles/1038670/ 📝 О чём: разбор причин, по которым RAG-прототип ломается в проде. Проблемы чанкинга длинных таблиц, эмбеддинги, не знающие корпоративный жаргон, ненадёжность top-k и cosine similarity, парсинг PDF и сканов, проброс ACL в метаданные, multi-hop запросы и сложность оценки качества без ground truth. В конце — набор приёмов: сужение домена, гибрид BM25 + векторный поиск через RRF, вынос структурированных данных в SQL. 📰 The Death of Traditional ETL: How AI Agents Are Rewriting Data Engineering (по метаданным) 🔗 https://medium.com/@arrufus/the-death-of-traditional-etl-... 📝 О чём: статья об использовании ИИ-агентов в data engineering. По доступному фрагменту — сценарий, где при изменении схемы выше по потоку ломается downstream-консьюмер, и агент берёт на себя трассировку lineage и починку джоба. 📰 Как мы построили сквозную аналитику в Power BI 🔗 https://habr.com/ru/articles/1038944/ 📝 О чём: кейс интегратора VSL-BI для компании по продаже стройматериалов. Сбор данных из Яндекс.Директ, Google Ads, Яндекс Метрики и Битрикс24 в отдельную аналитическую БД на MySQL, загрузка через Python, объединение продаж и рекламных источников по UTM-меткам, построение модели данных и дашбордов в Power BI с метриками ДРР, CpC, CpL, CR. 📰 OCR для Data Lakehouse: от Apache Tika к Docling 🔗 https://habr.com/ru/companies/diasoft_company/articles/1039044/ 📝 О чём: путь команды Диасофт от Apache Tika + Tesseract к собственному сервису парсинга документов на базе docling-serve. Описана гибридная архитектура: лёгкий анализ структуры (Layout, TableFormer, Figure Classifier) локально, тяжёлая VL-модель — за внешним шлюзом Digital Q.GPT по OpenAI-протоколу. Рекурсивная обработка вложений, OCR изображений внутри Office-документов, бенчмарки по скорости, CER и потреблению ресурсов в Kubernetes. 📰 Бизнес-аналитика для сети из 300 аптек 🔗 https://habr.com/ru/companies/w_code/articles/1039952/ 📝 О чём: внедрение BI-системы интегратором «Белый код» для аптечной сети поверх «СмартАптеки». Пять витрин — оперативный мониторинг с почасовым обновлением, сводка по сети с KPI и LFL, продажи с цветовой индикацией, остатки с drill-down, финансы. Прогноз продаж на день и месяц с учётом времени последней продажи в каждой точке, отдельный мобильный дашборд. 📰 ИИ в работе с данными: почему без человека пока никак 🔗 https://habr.com/ru/companies/yandex_praktikum/articles/1039950/ 📝 О чём: пересказ вебинара Яндекс Практикума о применении ИИ аналитиками и дата-сайентистами. Сценарии использования (борьба с «белым листом», ревью кода, саммари по данным, второе мнение), обзор инструментов (чат-боты, Perplexity, NotebookLM, ИИ-агенты) и ограничения: ИИ не учитывает корнер-кейсы, чувствителен к формулировке запроса и не понимает доменный контекст. 📰 Inside AI Meetup (Wildberries) — записи докладов 🔗 https://habr.com/ru/companies/wildberries/articles/1040624/ 📝 О чём: анонс с видеозаписями и презентациями митапа Wildberries & Russ от 20 мая. Доклады по AIOps на платформе KeepHQ, автоматическим guardrails (МФТИ), Discovery-платформе VK, отекстовке видео, поиску вакансий на Avito, ИИ-платформе M2, векторной модерации с 200+ моделями и RAG-ассистенту MWS на QWEN3-8B, BGE-M3 и гибридном поиске Vector + BM25 через RRF.
Дайджест статей 📰 RAG в энтерпрайзе: почему демо работает, а прод нет 🔗…
Из этого канала
- #2884"Понравилось из последнего Пелевина ""— У меня, как у физика, своя философия, —…
"Понравилось из последнего Пелевина ""— У меня, как у физика, своя философия, — начинает Александр Исакович. — Она проста.
- #2885И еще в продолжении темы про новый роман Пелевина, есть есть очень…
И еще в продолжении темы про новый роман Пелевина, есть есть очень примечательный блок про его рассуждение на тему ИИ и творчества.
- #2886Что такое творчество в положительном определении — сказать невозможно. Но…
Что такое творчество в положительном определении — сказать невозможно. Но возможно апофатическое: творчество есть то, к чему ИИ не способен в силу своей…
- #2882Goldman Sachs: токены становятся новой болью AI-экономики AI-агенты превращают…
Goldman Sachs: токены становятся новой болью AI-экономики AI-агенты превращают бум нейросетей в первый серьёзный тест на стоимость.
- #2881Пора делать фьючерсы на токены
Пора делать фьючерсы на токены