Практически каждый проект в инжиниринге данных начинается с package manager… — @rockyourdata

Практически каждый проект в инжиниринге данных начинается с package manager (пакетный менеджер), как правило для Python. С одной стороны у всех цель одна, а с другой стороны “кто в лес, кто по дрова”. Мне попались 3 хорошие статьи от Dagster на эту тему (про сам Dagster там нет), в которых хорошо рассказывают как это работает и как сделать удобно и красиво. Python Packages: a Primer for Data People (part 1 of 2) Python Packages: a Primer for Data People (part 2 of 2) Best Practices in Structuring Python Projects Вообще там 11 частей, в каждом посте будут ссылки на все части, например есть и другие полезные: High-performance Python for Data Engineering Write-Audit-Publish in data pipelines Breaking Packages in Python CI/CD and Data Pipeline Automation (with Git) Factory Patterns in Python Type Hinting in Python Environment Variables in Python Если вы еще на “вы” со всеми этими менеджерами, зависимостями или не очень понимаете, что творится у вас на работе в репозитории, то будет полезно ознакомиться.

Из этого канала