"Короткие тезисы по стриму о Kafka от Монса Монс, он же Владимир Перепелица - огромный спец в распределенных технологиях и архитектурном ""харде"". Один из авторов Tarantool и VK S3, на котором мы строим свои Лейкхаусы. Тезисы, которые выписал себе по ходу стрима о Кафке, НАТСе, очередеях и стриминге данных. Когда внедряем Kafka 1️⃣ Kafka - Commodity инструмент для работы с потоками данных. Если нужна СУБД, берешь Postgres, если нужен стрим, берешь Kafka. 2️⃣ Kafka добавляет в данные измерение времени. В СУБД как правило - текущий снапшот данных. В Кафке автоматически и почти бесплатно генерируются истории изменений, которые потом может прочитать любой потребитель, а не только тот, кто их генерировал. 3️⃣ Идеальный сценарий работы для Kafka - генерируем поток данных или лог изменений состояний, не зная заранее, кому и зачем он может понадобиться. О движках 1️⃣ Kafka 4.x - переход на KRaft с Zookeeper. Отныне эта опция по умолчанию. 2️⃣ KRaft лучше и стабильнее, так как все данные и метаданные о топиках, консьюмерах хранятся в одной системе а не двух. Не тратим время на согласование из системы в систему и нет риска, что данные и метаданные в какой-то момент разъедутся. 3️⃣ Граница между движком очереди и движком стрима практически стерта сейчас. Стримы умеют в семантику очереди, очереди умеют в стримы. О растянутых между ЦОД кластерах 1️⃣ На расстоянии между ЦОД в десятки милисекунд синхронные транзакции работают хорошо. Этого достаточно чтобы сходить туда-обратно и подтвердить, что данные зафиксированы. 2️⃣ Проблема с синхронными транзакциями начнется когда и если на один пользовательский запрос мы начинаем тратить 10-50 транзакций. Это неверная архитектура приложения. Так делать не надо. 3️⃣ Правильный путь - делаем свои 10-50 изменений в приложении и в конце подтверждаем все одной распределенной транзакцией. 4️⃣ Альтернатива - садим в соседний ЦОД а-синхронную реплику и смиряемся с тем фактом, что некоторые данные при плохом раскладе мы моежм потерять Запись стрима можно посмотреть здесь Архитектор Данных"
"Короткие тезисы по стриму о Kafka от Монса Монс, он же Владимир Перепелица -…
Из этого канала
- #323Lakehouse: открытая встреча / демо, Алексей Белозерский, VKCloud Друзья, тема…
Lakehouse: открытая встреча / демо, Алексей Белозерский, VKCloud Друзья, тема Lakehouse внезапно оказалась очень востребованной.
- #324Как построить и как жить в домике у озера. Задай свой вопрос в треде, и мы…
Как построить и как жить в домике у озера. Задай свой вопрос в треде, и мы обязательно его озвучим на сегодняшнем стриме. Запись будет - это не вопрос.
- #325Основные идеи Apache Iceberg одной картинкой 1️⃣ Метаданные важнее данных.…
Основные идеи Apache Iceberg одной картинкой 1️⃣ Метаданные важнее данных. Может лежать много паркетов, но если нет их описания в манифестах, то никто их…
- #320Завтра стрим с Владимиром Перепелицей Уже завтра, 6-го ноября в 18:00 MSK…
Завтра стрим с Владимиром Перепелицей Уже завтра, 6-го ноября в 18:00 MSK состоится очередная Q&A сессия.
- #319Точно стоит послушать человека, написавшего свою СУБД (Tarantool)
Точно стоит послушать человека, написавшего свою СУБД (Tarantool)