"Как я чищу метаданные Apache Airflow 3.x В блоге Apache Airflow есть скрипт для периодической чистки метаданных в БД Apache Airflow. Но начиная с Airflow 3.0 невозможно обращаться к БД напрямую (через модели SQLAlchemy), в связи с этим скрипт не работает. Даже вызов shell команды `airflow db clean` через BashOperator выдаст ошибку по типу: ```Could not parse SQLAlchemy URL from string 'airflow-db-not-allowed:///': source=""airflow.task.hooks.airflow.providers.standard.hooks.subprocess.SubprocessHook""``` ```RuntimeError: Direct database access via the ORM is not allowed in Airflow 3.0``` Как решить? Я нашел выход запуска через старый добрый Cron: ```0 0 * * * /home/airflow/.airflow/bin/airflow db clean --clean-before-timestamp ""$(date -d '7 days ago' +'%Y-%m-%d %H:%M:%S')"" --skip-archive -y``` В полночь команда запускается и чистит все данные , оставляя только последние 7 дней. Но это работает на моём личном self-hosted Airflow, как быть с MWAA я пока не знаю, т.к. не обновлялся и не знаю как поведёт себя DAG."
"Как я чищу метаданные Apache Airflow 3.x В блоге Apache Airflow есть скрипт…
Из этого канала
- #654Data Engineering Design Patterns 🔥 В сети бесплатно раздают электронную копию…
Data Engineering Design Patterns 🔥 В сети бесплатно раздают электронную копию книги Data Engineering Design Patterns. Я её ещё не читал.
- #655Jetbrains DataGrip бесплатно для некоммерческих целей Теперь JetBrains DataGrip…
Jetbrains DataGrip бесплатно для некоммерческих целей Теперь JetBrains DataGrip можно использовать бесплатно в некоммерческих целях.
- #656"MCP сервер для Apache Airflow Нашел репозиторий с готовым MCP сервером для…
"MCP сервер для Apache Airflow Нашел репозиторий с готовым MCP сервером для Apache Airflow — mcp-server-apache-airflow MCP или Model Context Protocol - это…
- #652Apache Airflow 3 в Amazon Cloud На Amazon стала доступна 3-я версия Apache…
Apache Airflow 3 в Amazon Cloud На Amazon стала доступна 3-я версия Apache Airflow: Introducing Apache Airflow 3 on Amazon MWAA: New features and capabilities…
- #651Очередной подгон в виде бесплатной книги от Astronomer — Orchestrating dbt with…
Очередной подгон в виде бесплатной книги от Astronomer — Orchestrating dbt with Apache Airflow® using Cosmos 🚀 Неплохой вводный гайд по оркестрации dbt…