Airflow vs Prefect vs Dagster на собеседовании Data Engineer

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Карьерник — Duolingo для аналитиков: 10 минут в день тренируй SQL, Python, A/B, статистику, метрики и ещё 3 темы собеса. 1500+ вопросов в Telegram-боте. Бесплатно.

Airflow

Industry standard. DAG-based с Python.

Pros: mature, huge ecosystem, providers.

Cons: old design, verbose, scheduler bottleneck legacy.

Prefect

Python-native, simpler API.

Pros: dynamic flows (loops, conditionals), simpler.

Cons: smaller ecosystem чем Airflow.

from prefect import flow, task

@task
def process(item):
    return item * 2

@flow
def my_flow(items):
    return [process(i) for i in items]

Dagster

Asset-centric. Models data products, не jobs.

Pros: strong typing, asset lineage, partitioning native.

Cons: different paradigm — learning curve.

from dagster import asset

@asset
def raw_data(): ...

@asset
def cleaned_data(raw_data): ...

@asset
def aggregated(cleaned_data): ...
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Сравнение

Airflow Prefect Dagster
Paradigm DAG of tasks Flows Assets
Typing Loose Better Strong
Dynamic Limited Native Native
Adoption Huge Growing Growing
Cloud / managed MWAA, Astronomer Prefect Cloud Dagster Cloud

В РФ Airflow — стандарт. Новые проекты иногда Prefect / Dagster.

Связанные темы

FAQ

Это официальная информация?

Нет. Статья основана на документации Airflow / Prefect / Dagster.


Тренируйте Data Engineering — откройте тренажёр с 1500+ вопросами для собесов.