ETL-инженер vs data-инженер

Проверь себя · 1/3разбор после ответа
Вы сортируете товары по величине скидки discount по убыванию. Поле discount может быть NULL (скидки нет). Чтобы товары без скидки всегда оказывались внизу независимо от настроек СУБД, какой вариант сортировки выбрать?

Короткий ответ

  • ETL-инженер — узкая роль: строит pipeline'ы extract-transform-load.
  • Data engineer — широкая роль: включает ETL + инфраструктуру, streaming, data platform.

В современных tech компаниях чаще встречается «data engineer». «ETL engineer» — более traditional title.

Сравнение

ETL Engineer Data Engineer
Главный фокус pipeline'ы ETL вся data infrastructure
Инструменты Informatica, SSIS, Talend, Airflow Airflow + Spark + Kafka + cloud
Форматы реляционные, CSV любые (JSON, Parquet, stream)
Облако меньше больше
Streaming редко часто
DWH / lake использует проектирует
Coding SQL + немного Python Python / Scala / Java + SQL
Зарплата РФ 150-250K ₽ 200-400K ₽

ETL Engineer

Задачи

  • Извлекать данные из source-систем (Oracle, SAP)
  • Трансформировать (очистка, enrichment, агрегация)
  • Загружать в DWH
  • Поддержка существующих pipeline'ов
  • Мониторинг и бейапка

Типичный стек

  • Legacy: Informatica, DataStage, SSIS, Talend (GUI-инструменты)
  • Modern: Airflow, dbt
  • SQL (продвинутый)
  • Python для custom логики

Где работают

  • Банки
  • Страховые
  • Enterprise с on-premise инфраструктурой
  • Традиционные ритейлеры

Data Engineer

Задачи

  • ETL/ELT: тот же pipeline work
  • Data platform: архитектура DWH / Lake / Lakehouse
  • Streaming: Kafka, Flink для real-time
  • Infrastructure: dev / prod environments, CI/CD
  • Data quality: frameworks для тестов и мониторинга
  • Cost optimization: оптимизация запросов / compute

Типичный стек

  • Orchestration: Airflow, Dagster, Prefect
  • Transform: dbt, Spark
  • Streaming: Kafka, Flink, Spark Streaming
  • Cloud: AWS / GCP / Azure (S3, EMR, Databricks, Snowflake, BigQuery)
  • Languages: Python, Scala, Java
  • Infrastructure: Terraform, Docker, Kubernetes

Где работают

  • Tech-компании (Yandex, VK, Avito, Ozon)
  • SaaS-стартапы
  • Fintech с modern stack
  • Компании с облачной инфраструктурой

Как развивалась роль

2000-е: ETL engineer с GUI-инструментами (Informatica). 2010-е: Появляется "data engineer" с Hadoop / Spark. 2020-е: Cloud + modern data stack (Snowflake, dbt, Fivetran). 2026: Data engineer = более широкая техническая роль, ближе к DevOps / backend.

Что ещё знает data engineer

Analytics Engineer

Под-специализация на стыке data engineering и analytics:

  • dbt + SQL + data modeling
  • Focus на business layer в DWH
  • Dimensional modeling (star schema)
  • Тесты данных
  • Self-service analytics infrastructure

Analytics Engineer — bridge между data engineer и analyst.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Примеры проектов

ETL Engineer

  • «Перегнать данные из Oracle → DWH каждую ночь»
  • «Добавить новую source — Salesforce в DWH»
  • «Fix slow query в ETL pipeline»

Data Engineer

  • «Построить real-time dashboard (stream processing)»
  • «Migrate data platform from on-premise to AWS»
  • «Build data lake для ML команды»
  • «Create data quality framework»
  • «Design new DWH schema для нового продукта»

Общие

  • SQL (продвинутый)
  • Python
  • Linux / Git
  • Data modeling

Уникальные для data engineer

  • Distributed systems (Spark, Hadoop)
  • Cloud platforms
  • Kubernetes / Docker
  • Streaming (Kafka)
  • Infrastructure as code (Terraform)
  • CI/CD

Кому что выбрать

ETL Engineer если:

  • Нравятся ясные, повторяющиеся задачи
  • Работаете в enterprise / банк
  • Не хотите DevOps-ных задач
  • Не гонитесь за максимумом зарплаты

Data Engineer если:

  • Нравится инфраструктура и system design
  • Хотите работать в tech-компаниях
  • Готовы к постоянному обучению
  • Интересна современная экосистема

Карьерный путь

ETL Engineer →

  • Senior ETL Engineer
  • Data Engineer (расширение стека)
  • Data Architect
  • BI Engineer

Data Engineer →

  • Senior Data Engineer
  • Staff / Principal Engineer
  • Data Platform Engineer
  • Tech Lead
  • Analytics Engineer (специализация)

На собесе

«Чем отличается ETL от data engineer?» ETL — часть data engineering. Data engineer знает ETL + infrastructure + streaming + cloud.

«Что важнее — ETL или data platform?» ETL — tactical. Platform — strategic. На middle+ уровне оба.

«Python или Scala?» Python доминирует. Scala — для Spark-heavy проектов в enterprise.

Связанные темы

FAQ

ETL engineer вымирает?

В tech — да. В enterprise — ещё работает. Modern stack = data engineer.

Можно ли перейти из ETL в data engineer?

Да. Нужно подтянуть cloud + streaming + infrastructure.

Analytics engineer — отдельная роль?

Да, specialized data engineer с focus на business / dbt / SQL.

Python хватит?

Для DE — да, как основной. Но Scala / Java полезны в больших компаниях с Spark.