Основные идеи Apache Iceberg одной картинкой 1️⃣ Метаданные важнее данных. Может лежать много паркетов, но если нет их описания в манифестах, то никто их читать не будет 2️⃣ Древовидная структура данных и метаданных, сходящаяся к одному корневому файлу. Записать и удалить много файлов - не-атомарная операция, но заменить один главный файл можно атомарно всегда в любой системе хранения. Отсюда почти-транзакционность. 3️⃣Хранение предыдущих состояний, таблица превращается в лог состояний с возможностью прочитать любую точку в истории. Но только старые версии надо потом подчищать через обсуживающие процедуры. 4️⃣ (Мета)Каталог как вспомогательный сервис. Для MVCC и честного ACID, для хранения статистики, RBAC и других обслуживающих функций Архитектор Данных
Основные идеи Apache Iceberg одной картинкой 1️⃣ Метаданные важнее данных.…
Из этого канала
- #326"О, это типичный пресейл или презентация продукта Продукт дает вам ""передовую…
"О, это типичный пресейл или презентация продукта Продукт дает вам ""передовую технологию"" Вы понимаете, что не все может пройти гладко.
- #327Делюсь записью вчерашнего видео Lakehouse для аналитиков и инженеров данных…
Делюсь записью вчерашнего видео Lakehouse для аналитиков и инженеров данных (Алексей Белозерский):…
- #328Настал этот день! Сегодня ровно в 18:00 время московское, мы начинаем стрим по…
Настал этот день! Сегодня ровно в 18:00 время московское, мы начинаем стрим по ML платформам! С Олегом Королевым, руководителем AI Lab компании Авито мы…
- #324Как построить и как жить в домике у озера. Задай свой вопрос в треде, и мы…
Как построить и как жить в домике у озера. Задай свой вопрос в треде, и мы обязательно его озвучим на сегодняшнем стриме. Запись будет - это не вопрос.
- #323Lakehouse: открытая встреча / демо, Алексей Белозерский, VKCloud Друзья, тема…
Lakehouse: открытая встреча / демо, Алексей Белозерский, VKCloud Друзья, тема Lakehouse внезапно оказалась очень востребованной.