Увидел интересное репо, в котором автор собрал локальный опенсорсный стек: Data Forge includes a complete modern data stack with industry-standard tools: __🗄️ Storage & Catalog __- __MinIO → S3-compatible object storage for data lakes __- __Hive Metastore → Centralized metadata catalog for tables and schemas ⚡ Compute Engines __- __Trino → Interactive SQL query engine for federated analytics __- __Apache Spark → Distributed processing for batch and streaming workloads 🌊 Streaming & CDC __- __Apache Kafka → Event streaming platform __- __Schema Registry → Schema evolution and compatibility __- __Debezium → Change data capture from databases 🗃️ Databases __- __PostgreSQL → Primary OLTP database (source system) __- __ClickHouse → Columnar analytics database (sink) 🔄 Orchestration __- __Apache Airflow 3 → Workflow orchestration 📊 Visualization & Exploration __- __Apache Superset → Modern BI and data visualization __- __JupyterLab → Interactive data science environment__ Идеальный стек для отечественного (СНГ) дата инженера. PS автору если интересно, может и вебинарчик провести для нас.