Один из свежих, хотя и не совсем новых трендов — это возврат от распределённых вычислений (distributed computing) к вычислениям на одном узле, как в старые добрые времена SMP. Пример — DuckDB. На картинке — типичный стек с DuckDB: всё локально, быстро, удобно. Но возникает вопрос — что произойдёт, если такой «одиночка» упадёт? Как быстро можно восстановиться? Для большинства небольших и средних компаний объёма до 1 ТБ вполне достаточно, а всё, что не помещается, можно спокойно держать рядом — например, в Apache Iceberg на S3. Использовал бы я duckDB? Ответ простой, для себя лично 100%, а вот как наемный сотрудник лучше делать ставку на проверенные технологии Spark, Trino, Snowflake и тп. Обычно так все и делают:)
Один из свежих, хотя и не совсем новых трендов — это возврат от распределённых…
Из этого канала
- #5183"Как измерить эффективность дата команды? Самый простой вариант это ROI…
"Как измерить эффективность дата команды? Самый простой вариант это ROI (возврат инвестиций).
- #5184Давненько никто никого не покупал. Свершилось - Datadog acquires AI-powered…
Давненько никто никого не покупал. Свершилось - Datadog acquires AI-powered observability startup Metaplane (AI там и не пахнет, так то).
- #5185Привет от Карлсона, который живет на крыше:)
Привет от Карлсона, который живет на крыше:)
- #5181"Вопросы на интервью: №5 What KPIs did you have in your previous/current role?…
"Вопросы на интервью: №5 What KPIs did you have in your previous/current role? 📌 А дальше - почти всегда: • How did you track progress? What tools did you use?…
- #5180Вот только закончили книгу по Snowflake, начинаем по Azure Databricks. Было…
Вот только закончили книгу по Snowflake, начинаем по Azure Databricks. Было много вопросов нафига ~~козе баян~~ делать Azure если есть просто Databricks.