Airflow vs Dagster
Карьерник — квиз-тренажёр в Telegram с 1500+ вопросами для собесов аналитика. SQL, Python, A/B, метрики. Бесплатно.
Зачем это знать
Orchestration — инфраструктурный слой data engineering. Если вы ETL/analytics engineer или просто middle-аналитик, знаете, что Airflow — многолетний стандарт. В 2020-х появились alternatives: Dagster, Prefect, Temporal. На собеседовании спросят: «какой orchestrator использовали», «почему».
Для карьеры: многие компании переходят с Airflow на Dagster. Понимание разницы — не теоретическое, а практическое.
В статье:
- Короткий ответ
- Философия каждого
- Сравнение
- Когда что
- Prefect как альтернатива
Короткий ответ
- Airflow — ветеран (2014+). Task-centric, DAG-based. Industry стандарт.
- Dagster — новое поколение (2019+). Asset-centric, развитая testability.
Airflow — «как запустить задачу». Dagster — «какой asset мы строим».
Airflow
Идеология
Task-first. Вы описываете DAG — граф задач. Airflow их планирует и выполняет.
from airflow import DAG
from airflow.operators.python import PythonOperator
dag = DAG('etl_daily', schedule='@daily')
task1 = PythonOperator(task_id='extract', python_callable=extract_fn, dag=dag)
task2 = PythonOperator(task_id='transform', python_callable=transform_fn, dag=dag)
task3 = PythonOperator(task_id='load', python_callable=load_fn, dag=dag)
task1 >> task2 >> task3Сильные стороны
- Огромная экосистема (Databricks, AWS, GCP)
- Community support
- Production-ready для enterprise
- Managed options: MWAA, Astronomer, Composer
Слабые стороны
- Testing сложен
- Не-pythonic в местах
- Наклон к XCom для data passing (плохо для big data)
- Scheduler-heavy
Dagster
Идеология
Asset-first. Описываете «что мы строим» (таблицы, датасеты), не «какие задачи».
from dagster import asset
@asset
def raw_orders():
return extract_orders()
@asset
def clean_orders(raw_orders):
return transform(raw_orders)
@asset
def orders_summary(clean_orders):
return aggregate(clean_orders)Dependency graph выводится автоматически.
Сильные стороны
- Type-safe, testable
- Отличная интеграция с dbt
- Data lineage из коробки
- Software engineering best practices
- Modern UI
Слабые стороны
- Моложе (меньше ecosystem)
- Не все managed services
- Команде нужно переучиваться
Сравнение
| Airflow | Dagster | |
|---|---|---|
| Возраст | 2014 | 2019 |
| Parad igм | task-centric | asset-centric |
| Testing | сложно | easy |
| dbt integration | через operator | native |
| Type checking | weak | strong |
| UI | functional | modern, polished |
| Community | огромный | растущий |
| Managed | MWAA, Astronomer | Dagster Cloud |
| Learning curve | средняя | средняя, но более современная |
Philosophical difference
Airflow DAG:
extract → transform → load«Процессы».
Dagster asset graph:
raw_data → cleaned_data → aggregated_data«Продукты» (datasets).
Это меняет подход. Dagster ближе к dbt философии: мы строим asset graph, а не task pipeline.
Prefect — ещё один кандидат
Prefect — тоже современный orchestrator. Philosophy — «negative engineering» (меньше boilerplate).
from prefect import flow, task
@task
def extract(): ...
@task
def transform(data): ...
@flow
def my_flow():
data = extract()
transformed = transform(data)Проще чем Airflow, менее opinion-ated чем Dagster.
Когда Airflow
- Legacy company с существующей Airflow инфраструктурой
- Нужны managed options (AWS MWAA, GCP Composer)
- Требуется широкая ecosystem интеграция
- Команда уже знает Airflow
Когда Dagster
- New project в 2025+
- Сильная интеграция с dbt
- Важна testability
- Asset-oriented thinking (data products)
- Современный tech stack
Когда Prefect
- Python-first команда
- Middle ground между Airflow и Dagster
- Нужен dynamic workflow (параметризация)
Migration Airflow → Dagster
Тренд 2024-2026 — компании переходят. Причины:
- Airflow не развивается достаточно быстро
- Dagster лучше для modern data stack
- dbt integration проще
- Team productivity выше
Но migration долгая (6-12 месяцев для большого проекта).
На собесе
«Какой orchestrator знаете?» Начните с Airflow (industry стандарт), упомяните Dagster как modern alternative.
«Почему dagster лучше?» Asset-centric, testable, native dbt. Не всегда лучше — зависит от контекста.
«Что бы выбрали для нового проекта в 2026?» Dagster или Prefect для new, Airflow если легаси.
Связанные темы
FAQ
Airflow мёртв?
Нет. Ещё несколько лет будет стандартом в enterprise.
Dagster дороже?
Core free. Cloud — платно. Managed Airflow тоже платный.
Prefect vs Dagster?
Оба modern. Prefect проще, Dagster мощнее для data pipelines.
Для мелкой команды нужен orchestrator?
Если есть ежедневные ETL — да. Можно начать с cron → перейти на Airflow/Dagster.
Тренируйте data engineering — откройте тренажёр с 1500+ вопросами для собесов.