Котятки😻, Всю конференцию по качеству данных меня терзал вопрос ‘Зачем?’ И… — @dashboardets

Котятки😻, Всю конференцию по качеству данных меня терзал вопрос ‘Зачем?’ И судя по одном из вопросов сотоварища из Сибура, не меня одну. А потом я дождалась рассказа Александра Ошуркова про то, как они с помощью ИИ наполнили дата-каталог. Наследие МКБ расползается) Что могу сказать: -это, вероятно, плохо сработает, если у вас в качестве источника 1С, когда логическая и физическая модели имеют неочевидные связи (но хорошо, что эти связи хоть где-то описаны). Но надеюсь, что ошибаюсь. -это точно сработает, если у вас низкий уровень абстракции в моделях -ну то есть простая 3nf нормас, а вот для data vault 2.0 надо или сплясать, или иметь очень хорошую документацию. Проверено уже на моих прототипах. -этот подход хорош, когда у вас единица описания -таблица, и вы не описываете преобразования и обогащения, то есть не касаетесь pipeline -ну а если вам еще в каталог занести pipeline, будте готовы к тому, что на условном Airflow с абстрактно названными дагами вряд ли что-то получится. У меня есть сомнения и по поводу его более человечного аналога, Дагстера, хоть эта статья меня и зацепила. https://habr.com/ru/amp/publications/867132/

Из этого канала