Теперь дока - мой верный друг В последнее время чувствую необходимость пойти в доку и почитать, если нужно что-то найти. Привожу список полезных ссылочек с небольшим описанием: ✨ Spark - движок для распределенных вычислений большого объема данных на нескольких машинках https://spark.apache.org/docs/latest/configuration.html 🐇 Trino - SQL-движок для запросов к разным видам источников данных https://trino.io/docs/current/index.html 👩💻Scala - Java-подобный язык (но не совсем) https://www.scala-lang.org/api/3.x/scala.html 👩💻 PyArrow - либа для работы с данными https://arrow.apache.org/docs/python/index.html 🐘 YARN API - API для менеджера ресурсов на кластере https://hadoop.apache.org/docs/stable/hadoop-yarn/hadoop-yarn-site/ResourceManagerRest.html 🍺 brew - менеджер пакетов для мака https://formulae.brew.sh/formula/ 👩💻 Python - ну что тут еще добавить https://docs.python.org/3/library/ 🌺 Airflow - оркестратор потоков обработки https://airflow.apache.org/docs/apache-airflow/stable/index.html ⛩ Jinja - шаблоны на питоне для динамической генерации https://jinja.palletsprojects.com/en/stable/ 👩💻 Docker - платформа для контейнеризации приложений https://docs.docker.com/reference/ 👨🏫 Bamboo - CI/CD https://confluence.atlassian.com/bamboo/bamboo-documentation-289276551.html 🗻 Iceberg - табличный формат хранения данных с транзакциями, возможностью иметь несколько версий таблицы и т.д. https://iceberg.apache.org/docs/latest/ 🟢 Apache ORC - колоночный формат хранения данных https://orc.apache.org/docs/index.html
Теперь дока - мой верный друг В последнее время чувствую необходимость пойти в…
Из этого канала
- #330ClickHouse Tips and Features Недавно один подписчик спрашивал, остались ли еще…
ClickHouse Tips and Features Недавно один подписчик спрашивал, остались ли еще какие-нибудь крутые презы по инструментам. Вот откопала презу по кх)
- #333Наткнулась на статью, которую опубликовал лид моего тимлида в прошлом году…
Наткнулась на статью, которую опубликовал лид моего тимлида в прошлом году https://habr.com/ru/companies/lamoda/articles/810705/
- #335"‼️ Я дропнула базу на проде ‼️ Ну... почти дропнула ➡️ перезаписала базу ➡️…
"‼️ Я дропнула базу на проде ‼️ Ну... почти дропнула ➡️ перезаписала базу ➡️ схему на проде ➡️ на деве Я просто сделала в спарке: ```( df .write…
- #326"Пост-мит dbt meetup Только что закончился dbt meetup Что было: 1️⃣""Данные под…
"Пост-мит dbt meetup Только что закончился dbt meetup Что было: 1️⃣""Данные под контролем: Great Expectations в деле"" База про что такое data quality, какие…
- #324rows between Когда я в декабре решала Advent of SQL, на 11 день было интересное…
rows between Когда я в декабре решала Advent of SQL, на 11 день было интересное задание - найти скользящее среднее по текущей строке с двумя предыдущими.