Техлид с опытом в дата-инжиниринге, выложил на Reddit в сабреддите r/dataengineering свой взгляд на open source инструменты для 2025 года. См. картинку, ну очень сложно - кликабельная, кстати. Он три года работал в изолированных средах, где облака были под запретом, и сосредотачивался больше на платформенной части, чем на работе с данными. За это время к задачам дата-инженеров добавились DevOps, MLOps, LLM, RAG и дата-лейкхаусы, помимо классических дата-стеков и хранилищ. Его подборка - набор инструментов вроде Apache Airflow, Spark, Kafka, dbt, PostgreSQL, ClickHouse и других, которые он использует для разных кейсов. Например, для оркестрации - Airflow, для аналитики - Superset, для машинного обучения - MLflow и JupyterHub. В комментариях народ активно обсуждает. Есть идеи добавить Redash для визуализации или Ballista с DataFusion для замены Spark. Мне одному кажется, что это слишком заморочисто :) ? Прикиньте, сколько надо учиться, чтобы освоить такую специальность?! Русский ИТ бизнес
Техлид с опытом в дата-инжиниринге, выложил на Reddit в сабреддите…
Из этого канала
- #190"В композии М.Круга ""Кольщик"" дан отличный пример хорошего…
"В композии М.Круга ""Кольщик"" дан отличный пример хорошего промпт-инжиниринга."
- #191Сними ограничения с ЧатГПТ, и он пойдет убивать людей своими дронами, говорили…
Сними ограничения с ЧатГПТ, и он пойдет убивать людей своими дронами, говорили они. Пока же ИИ с успехом убивает себя 😎
- #192Про курсы Продолжая аналогию. На курсах гитары (от Скилбокса и Практикума) вас…
Про курсы Продолжая аналогию. На курсах гитары (от Скилбокса и Практикума) вас научат четырем аккордам, мотивируя тем что Metallica собирает стадионы и…
- #188Говорят, выглядит страшно. Хотя что там страшного, умеючи. Половина в облаке…
Говорят, выглядит страшно. Хотя что там страшного, умеючи. Половина в облаке поднимается. Сиди себе и кнопочки тыкай
- #185Часто слышу вопрос: «А зачем нам отдельная выделенная команда данных? Вон у нас…
Часто слышу вопрос: «А зачем нам отдельная выделенная команда данных? Вон у нас все разработчики умеют в SQL, все менеджеры на ты с Экселем.