📋 Дайджест: #cdo_club 📰 Что такое Dark Factory AI Agent? 🔗 https://habr.com/ru/articles/1034840/ 💡 Вывод: Граница автономности агентного пайплайна — это не свойство модели, а сознательное архитектурное решение. Цикл generate-test-fix работает только при тестируемых критериях приёмки и явных точках эскалации на человека; без них пайплайн либо зацикливается на размытой спецификации, либо тихо отправляет в прод плохой код. Бенчмарк «40% реальных GitHub issues решено автономно» — это про задачи с готовым failing test, а не про продуктовые решения. 📰 DWH в 2026: четыре зоны вместо Inmon, Kimball и Data Vault 2.0 🔗 https://habr.com/ru/articles/1035136/ 💡 Вывод: Звёздная схема и 3NF в аналитике устарели не из-за моды, а из-за физики колоночных движков — runtime-джойн дороже хранения денормализованных дублей. Ключевое архитектурное решение сегодня — разделение serving-layer (ClickHouse) и трансформационного движка (Trino) поверх одного Iceberg-каталога, а не выбор методологии. Отдельно полезный сигнал: ClickHouse 25.x пока не заменяет Trino поверх Iceberg (нет equality deletes, нет distributed reads, запись experimental) — маркетинг обгоняет реальность. 📰 Почему без архитектора контента невозможно масштабировать документацию компании 🔗 https://habr.com/ru/companies/pt/articles/1035106/ 💡 Вывод: Документация масштабируется по тем же принципам, что и данные — переиспользуемые блоки вместо монолитных документов, метаданные жизненного цикла, taxonomy, отделённая от инструмента публикации. Кейс Positive Technologies (95% переиспользования текста, обновление EULA для 26 продуктов за день, −35–50% времени локализации) — это data engineering для текстов; роль «архитектор контента» закрывает тот же gap, что data architect, только для unstructured-нагрузки. 📰 Why Traditional ETL is Dead: The Rise of Agentic Data Engineering 🔗 https://medium.com/@seaflux/why-traditional-etl-is-dead-the-rise-of-agentic-data-engineering-34c4311f1d6c 💡 Вывод: Тезис «ETL мёртв» — маркетинговый ярлык на реальной проблеме: пайплайны, не умеющие самостоятельно реагировать на schema drift и нагрузочные изломы (2 TB → 20 TB), становятся точкой найма, а не точкой автоматизации. Содержательный вопрос — не «убить ETL», а где в существующем пайплайне явная декларативная спецификация контракта, на которую агент может опереться. 📰 Rethinking Analytics Teams in the Age of Agentic AI 🔗 https://elesin-olalekan.medium.com/rethinking-analytics-teams-in-the-age-of-agentic-ai-85c40ace92b1 💡 Вывод: Реальный сдвиг не в том, что AI заменяет аналитиков, а в том, что цикл «запрос → ответ» сжимается с недель до часов. Ticket-driven модель аналитической команды (бизнес заводит тикет → аналитик пишет SQL → дашборд через спринт) перестаёт окупаться, когда тот же путь агент проходит за минуты — и команды, которые не переосмыслили операционную модель, обнаружат, что их KPI измеряют толщину очереди, а не ценность ответов. 📰 If You Understand These 5 Data Engineering Terms, You're Ahead of 90% of the Industry 🔗 https://medium.com/towards-data-engineering/if-you-understand-these-5-data-engineering-terms-youre-ahead-of-90-of-the-industry-a2da363aa64d 💡 Вывод: Заголовок-кликбейт, но рамка («core physics of data architecture without getting lost in the SaaS hype») — рабочий фильтр для собеседований и архитектурных дискуссий: если кандидат или вендор оперирует только брендами стека (Snowflake, Databricks, Fabric) и не может объяснить физику нагрузки (партиционирование, идемпотентность, schema evolution, ordering, consistency) — он продаёт логотипы, а не решает задачу.