Котятки, Сегодня я тусю на конференции по качеству данных, и меня волнует… — @dashboardets

Котятки, Сегодня я тусю на конференции по качеству данных, и меня волнует один вопрос: как не сойти с ума от слова ‘контроль’? Итак, я бы выделяла три аспекта разглядывания и дальше в них игралась: -data quality как процесс -data quality как инструмент -data quality как результат. Так как еще со времен работы с SAS DQ у меня дергается глаз, а на работу я хожу чисто поесть , для себя я когда-то сформировала ‘Манифест анархиста’, который позволяет мне минимизировать набор действий и держать качество данных на уровне, чтобы бизнес не визжал. Это не решение ‘в пользу бедных’, скорее, в пользу самостоятельности. И кое-что да, выходит дорого. Итак, 1 data quality как процесс просто вычеркивается из списка, нет отдельного процесса/типа тикетов/команды/порядка реакции и костов на обслуживание этого процесса. Организация работы должна быть сведена к работе с инцидентам 2 Инструмент data quality: должен работать как входной контроль из источника в DWH, лучше в формате API. 3 Результат data quality: попадание в согласованный SLA по точности, где он выставляется. Все. Где тут возникают проблемы и развилки? -классификация инцидентов, оф корс, -промежуточный контроль -профилирование -инструменты data quality с api/нужен ли фронт для них вообще И пр. Ну и главный вопрос, который вызывает диалоги - fk или не fk P.S. Сейчас смотрю концепцию, которая реализована в Data Ladder, их философия близка к моей https://dataladder.com

Из этого канала