Вопросы со стрима часть 2 Спасибо, Сергей Сафронов, за вопрос! 1️⃣__ Если не говорить про управляемые облака, то, кажется, что ограничением по по объему данных для унифицированного LakeHouse на S3 opensource движках (Minio, Ceph) будет примерно 1ПБ. А если нужно больше, то, или смотреть в сторону облаков, или делать несколько кластеров S3 с усложнением и архитектуры хранения-обработки?__ Для дата команды S3 - базовая инфраструктура. Сколько там кластеров, какие они и как распределены по ЦОДам - вопрос к инфраструктуре. Сейчас довольно много способов получить S3 либо в SaaS, либо развернуть у себя в контуре - как самостоятельно, так и просто купив S3 как продукт или ПАК. 2️⃣__Кажется, что Вадим несколько лукавил про простоту и быстроту миграции на LakeHouse данных. Все-таки, факторы бэклога инженеров, их компетенции в новых технологиях, сетевая доступность и разная конфигурация (разное шардирование) кластеров источника и приемника, разный формат хранения, возможно, разная архитектура слоев данных и многое другое. Поэтому, слабо верится, с учетом этого, что миграция может пройти за месяц (если я правильно понял срок)__ Тут речь шла про прикладную миграцию данных. Data Vault в Гринпламе на Data Vault в Lakehouse. Для такого не нужно много времени и переделки архитектуры. 3️⃣__ Есть ли какие-то best practice по оптимальной архитектуре слоев данных в LakeHouse с учетом разных движков доступа (Trino +) и разных сценариев использования? С точки зрения технических ограничений и особенностей (для примера, в ClickHouse нет смысла делать Data Vault и вообще 3NF)__ В крупных организациях почти везде DV так или иначе. Плохеет ли от ДатаВолта распределенной системе - конечно плохеет. Но мы снова платим оверхедом за удобство и скорость разработки. К тому же проблему «неудобной» для МРР архитектуры данных можно решить добавив ресурсов в некоторых разумных проблемах. Нет смысла подгонять архитектуру данных под инструмент. Пусть работает, как нам удобно, тупая железяка! 😎 ----------------------------- Разбор стрима Вопросы со стрима - Часть 1 -----------------------------
Вопросы со стрима часть 2 Спасибо, Сергей Сафронов, за вопрос! 1️⃣ Если не…
Из этого канала
- #213Архитектор и три его джуна осматривают озеро данных, почти превращенное в…
Архитектор и три его джуна осматривают озеро данных, почти превращенное в болото. Усадьба Кусково.
- #214Эпоха сражающихся хранилищ Из недавней беседы с весьма уважаемым ИТ-лордом.…
Эпоха сражающихся хранилищ Из недавней беседы с весьма уважаемым ИТ-лордом. Типичная динамика КХД в организации.
- #215"""Порог входа, бабушка. Все дело - в пороге входа"""
"""Порог входа, бабушка. Все дело - в пороге входа"""
- #210У нас было (Жиза) 💾 17 ETL джобов из ниоткуда в никуда, которые загружали под…
У нас было (Жиза) 💾 17 ETL джобов из ниоткуда в никуда, которые загружали под крышку MPP базу на 50 ТБайт 💾 Красивый технологичный AI Layer который делал…
- #209Рабочая проверка №2 - для кандидатов В ходе беседы находишь пункт, который а)…
Рабочая проверка №2 - для кандидатов В ходе беседы находишь пункт, который а) кандидат явно не знает б) важен для тебя / твоей позиции Прозрачно говоришь, что…