Airflow vs Dagster

Карьерник — квиз-тренажёр в Telegram с 1500+ вопросами для собесов аналитика. SQL, Python, A/B, метрики. Бесплатно.

Зачем это знать

Orchestration — инфраструктурный слой data engineering. Если вы ETL/analytics engineer или просто middle-аналитик, знаете, что Airflow — многолетний стандарт. В 2020-х появились alternatives: Dagster, Prefect, Temporal. На собеседовании спросят: «какой orchestrator использовали», «почему».

Для карьеры: многие компании переходят с Airflow на Dagster. Понимание разницы — не теоретическое, а практическое.

В статье:

  • Короткий ответ
  • Философия каждого
  • Сравнение
  • Когда что
  • Prefect как альтернатива

Короткий ответ

  • Airflow — ветеран (2014+). Task-centric, DAG-based. Industry стандарт.
  • Dagster — новое поколение (2019+). Asset-centric, развитая testability.

Airflow — «как запустить задачу». Dagster — «какой asset мы строим».

Airflow

Идеология

Task-first. Вы описываете DAG — граф задач. Airflow их планирует и выполняет.

from airflow import DAG
from airflow.operators.python import PythonOperator

dag = DAG('etl_daily', schedule='@daily')

task1 = PythonOperator(task_id='extract', python_callable=extract_fn, dag=dag)
task2 = PythonOperator(task_id='transform', python_callable=transform_fn, dag=dag)
task3 = PythonOperator(task_id='load', python_callable=load_fn, dag=dag)

task1 >> task2 >> task3

Сильные стороны

  • Огромная экосистема (Databricks, AWS, GCP)
  • Community support
  • Production-ready для enterprise
  • Managed options: MWAA, Astronomer, Composer

Слабые стороны

  • Testing сложен
  • Не-pythonic в местах
  • Наклон к XCom для data passing (плохо для big data)
  • Scheduler-heavy

Dagster

Идеология

Asset-first. Описываете «что мы строим» (таблицы, датасеты), не «какие задачи».

from dagster import asset

@asset
def raw_orders():
    return extract_orders()

@asset
def clean_orders(raw_orders):
    return transform(raw_orders)

@asset
def orders_summary(clean_orders):
    return aggregate(clean_orders)

Dependency graph выводится автоматически.

Сильные стороны

  • Type-safe, testable
  • Отличная интеграция с dbt
  • Data lineage из коробки
  • Software engineering best practices
  • Modern UI

Слабые стороны

  • Моложе (меньше ecosystem)
  • Не все managed services
  • Команде нужно переучиваться

Сравнение

Airflow Dagster
Возраст 2014 2019
Parad igм task-centric asset-centric
Testing сложно easy
dbt integration через operator native
Type checking weak strong
UI functional modern, polished
Community огромный растущий
Managed MWAA, Astronomer Dagster Cloud
Learning curve средняя средняя, но более современная

Philosophical difference

Airflow DAG:

extract → transform → load

«Процессы».

Dagster asset graph:

raw_data → cleaned_data → aggregated_data

«Продукты» (datasets).

Это меняет подход. Dagster ближе к dbt философии: мы строим asset graph, а не task pipeline.

Prefect — ещё один кандидат

Prefect — тоже современный orchestrator. Philosophy — «negative engineering» (меньше boilerplate).

from prefect import flow, task

@task
def extract(): ...

@task
def transform(data): ...

@flow
def my_flow():
    data = extract()
    transformed = transform(data)

Проще чем Airflow, менее opinion-ated чем Dagster.

Когда Airflow

  • Legacy company с существующей Airflow инфраструктурой
  • Нужны managed options (AWS MWAA, GCP Composer)
  • Требуется широкая ecosystem интеграция
  • Команда уже знает Airflow

Когда Dagster

  • New project в 2025+
  • Сильная интеграция с dbt
  • Важна testability
  • Asset-oriented thinking (data products)
  • Современный tech stack

Когда Prefect

  • Python-first команда
  • Middle ground между Airflow и Dagster
  • Нужен dynamic workflow (параметризация)

Migration Airflow → Dagster

Тренд 2024-2026 — компании переходят. Причины:

  • Airflow не развивается достаточно быстро
  • Dagster лучше для modern data stack
  • dbt integration проще
  • Team productivity выше

Но migration долгая (6-12 месяцев для большого проекта).

На собесе

«Какой orchestrator знаете?» Начните с Airflow (industry стандарт), упомяните Dagster как modern alternative.

«Почему dagster лучше?» Asset-centric, testable, native dbt. Не всегда лучше — зависит от контекста.

«Что бы выбрали для нового проекта в 2026?» Dagster или Prefect для new, Airflow если легаси.

Связанные темы

FAQ

Airflow мёртв?

Нет. Ещё несколько лет будет стандартом в enterprise.

Dagster дороже?

Core free. Cloud — платно. Managed Airflow тоже платный.

Prefect vs Dagster?

Оба modern. Prefect проще, Dagster мощнее для data pipelines.

Для мелкой команды нужен orchestrator?

Если есть ежедневные ETL — да. Можно начать с cron → перейти на Airflow/Dagster.


Тренируйте data engineering — откройте тренажёр с 1500+ вопросами для собесов.