DataFusion Comet Продолжаем разбор интересных докладов. Сегодня - доклад с Iceberg Summit 2024 про движок Comet от Чао Сана (Chao Sum) Staff Engineer OpenAI Comet - переписанный на Rust движок вычислений для Spark с векторизацией (SIMD). Включается как Drop-In Replace, если не может по какой-то причине, то сам фолл-бечится на Scala. В итоге получаем скорость Rust, не теряя богатство экосистемы Spark и его API. На бумаге. В докладе неплохо разобрано, как выглядит с точки зрения Спарка простой запрос. Потом добавляем к нему векторизацию. Видео c таймкодами ниже в канале или на ВК. Оригинал Youtube - без таймкодов. Ранее в разборах: Часть 1 - Разбор нововведений Iceberg v3 Часть 2 - Streaming Data Lake - Redpanda ------------------------------------ ------ Архитектор данных ------- ------------------------------------
DataFusion Comet Продолжаем разбор интересных докладов. Сегодня - доклад с…
Из этого канала
- #40301:15 - Улучшаем производительность нативного движка Spark 05:10 - Как…
01:15 - Улучшаем производительность нативного движка Spark 05:10 - Как исполняется код на Spark под капотом и его узкие места 08:45 - Векторизованная модель…
- #404В коментах вспомнили отличный доклад на Smart Data 2025. Ребята измерили, как…
В коментах вспомнили отличный доклад на Smart Data 2025. Ребята измерили, как на практике работает Comet (Rust), Velox (C++) движки Spark'а.
- #405На тему альтернативных движков Spark - офигенный доклад со Smart Data 2025 от…
На тему альтернативных движков Spark - офигенный доклад со Smart Data 2025 от Евгения Глотова из Navio Видео пока что за пейволом, но слайды (70 слайдов) можно…
- #400Хозяйке на заметку. Если нейросеть тупит, просто повторите промпт еще разик
Хозяйке на заметку. Если нейросеть тупит, просто повторите промпт еще разик
- #399Meta[store] Mesh - ловите новый термин 😁
Meta[store] Mesh - ловите новый термин 😁