Собеседование на Data Engineer в X5 Tech

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему X5 Tech — особенный работодатель для DE

X5 Tech — IT-подразделение X5 Group (Пятёрочка, Перекрёсток, Чижик, Vprok). Огромный retail-стек: тысячи магазинов, миллионы транзакций в день, supply chain через всю страну, лояльность, e-com (Vprok), доставка. DE-задачи: ETL-pipeline для аналитики, RecSys в Vprok, прогнозирование спроса, supply chain optimization.

Стек — современный для российского retail: Airflow, dbt, ClickHouse, Spark, Kafka, частично облачные решения. Особенность — retail-домен: понимание категорий, supply chain, лояльности — отдельный навык. Актуальные вакансии — на карьерной странице X5 Tech.

Информация основана на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с HR (30-40 минут)

Знакомство:

  • Стек DE, опыт
  • Готовность к retail-домену
  • В какую команду заходишь (Analytics / RecSys / Supply Chain / E-com)

Питч 90 секунд.

2. SQL глубоко (60-90 минут)

Retail — много транзакционных данных. SQL — основной язык DE.

Что спрашивают:

  • Window functions, CTE, оконные агрегаты
  • Дедупликация транзакций
  • Slowly changing dimensions (товарный каталог меняется)
  • ClickHouse query language

Подготовка: SQL для DE, SQL-тренажёр.

3. Алгоритмы / coding (60 минут)

LeetCode Easy-Medium. Python обычно. Иногда — задача на чистый Python без библиотек.

4. Стек DE (60-90 минут)

X5 Tech современный стек:

  • Airflow: DAG-дизайн, sensors, backfill
  • dbt: модели, тесты, документация
  • ClickHouse: MergeTree, distributed tables
  • Spark: trade-off с ClickHouse для аналитики

Вопросы:

  • Когда Airflow vs cron
  • dbt тесты: not_null, unique, accepted_values
  • ClickHouse vs Postgres для аналитики

Подготовка: Airflow паттерны, ClickHouse и OLAP, Airflow на собесе DE, dbt тесты.

5. DE system design (60-90 минут)

Сценарии retail:

  • «Пайплайн дневных продаж: 5k магазинов, час до открытия аналитического дашборда»
  • «Real-time RecSys для Vprok: товары в корзине → рекомендации за 200ms»
  • «Demand forecasting на 18000 SKU на 6 недель вперёд»

Что оценивают:

  • Retail-специфика: SKU vs категории, иерархия магазинов / регионов
  • Batch vs streaming trade-off
  • Data modeling: fact_sales, dim_product, dim_store
  • Slowly changing dimensions (товары приходят / уходят)

Подготовка: data modeling.

6. Поведенческое / фит

STAR. У X5 фокус:

  • Опыт работы с большими таблицами (миллиарды строк)
  • Как декомпозировал большой ETL-проект
  • Конфликт с бизнесом по поводу требований
  • Решение под deadline (вечер-к-утру)

Особенности направлений

Направление Стек / задачи
Analytics / BI Airflow + dbt + ClickHouse, BI на Apache Superset / Tableau
Vprok (e-com) Real-time для RecSys, классические e-com pipelines
Loyalty (Пятёрочка) Customer 360°, retention аналитика
Supply Chain Прогноз спроса, оптимизация заказов, инвентари
Pricing Dynamic pricing pipelines, конкурентная аналитика
Data Platform Внутренние data-tools

Что X5 ценит в DE

  • Retail mindset. Понимать различие SKU vs категории, hierarchy магазинов, SCD для товарного каталога
  • SQL глубоко. В retail DE пишет SQL ежедневно, причём для бизнес-юзеров
  • Production-mindset. Тесты ETL, dbt-тесты, мониторинг freshness
  • Pragmatism. Не «идеальная архитектура за 6 месяцев», а «бизнес-результат за 3-4 недели»
  • Domain-aware. Понимание категорий, магазинов, supply chain
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. SQL deep. Window functions, оптимизация, SCD типы.
  2. Airflow + dbt. Airflow на собесе DE, dbt тесты.
  3. ClickHouse. ClickHouse и OLAP subtopic.
  4. Data modeling. Star schema, dimensional modeling, SCD type 2.
  5. Retail-кейсы. Demand forecasting, RecSys для e-com, inventory.
  6. STAR-истории. Большие ETL-проекты, deadline-pressure.

Частые ошибки

  • Игнор retail-специфики. «Сделаю как для соцсети» — не работает для SKU-driven данных
  • Слабый SQL. В retail DE пишет SQL для бизнес-юзеров много, на больших таблицах
  • Без dbt. Современный retail-стек требует dbt-подобной декларативной трансформации
  • SCD не учитывается. Товарный каталог меняется постоянно (цены, описания). Без SCD type 2 — провал
  • System design без масштаба. Решение для 100 магазинов не работает для 20k

Связанные темы

FAQ

Сколько раундов в X5 для DE?

Обычно 4-5: HR → SQL → coding → стек / system design → фит. Срок 3-5 недель.

Нужен ли retail-опыт?

Желательно, но не строго. Сильный DE без retail проходит, специфику можно подучить.

Какой основной стек?

Airflow + dbt + ClickHouse + Spark. В разных командах акцент разный.

Берут ли junior DE?

Через стажировки X5 Tech. Программы есть.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.