Собеседование на Data Engineer в X5 Tech
Содержание:
Почему X5 Tech — особенный работодатель для DE
X5 Tech — IT-подразделение X5 Group (Пятёрочка, Перекрёсток, Чижик, Vprok). Огромный retail-стек: тысячи магазинов, миллионы транзакций в день, supply chain через всю страну, лояльность, e-com (Vprok), доставка. DE-задачи: ETL-pipeline для аналитики, RecSys в Vprok, прогнозирование спроса, supply chain optimization.
Стек — современный для российского retail: Airflow, dbt, ClickHouse, Spark, Kafka, частично облачные решения. Особенность — retail-домен: понимание категорий, supply chain, лояльности — отдельный навык. Актуальные вакансии — на карьерной странице X5 Tech.
Информация основана на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.
Этапы собеседования
1. Скрининг с HR (30-40 минут)
Знакомство:
- Стек DE, опыт
- Готовность к retail-домену
- В какую команду заходишь (Analytics / RecSys / Supply Chain / E-com)
Питч 90 секунд.
2. SQL глубоко (60-90 минут)
Retail — много транзакционных данных. SQL — основной язык DE.
Что спрашивают:
- Window functions, CTE, оконные агрегаты
- Дедупликация транзакций
- Slowly changing dimensions (товарный каталог меняется)
- ClickHouse query language
Подготовка: SQL для DE, SQL-тренажёр.
3. Алгоритмы / coding (60 минут)
LeetCode Easy-Medium. Python обычно. Иногда — задача на чистый Python без библиотек.
4. Стек DE (60-90 минут)
X5 Tech современный стек:
- Airflow: DAG-дизайн, sensors, backfill
- dbt: модели, тесты, документация
- ClickHouse: MergeTree, distributed tables
- Spark: trade-off с ClickHouse для аналитики
Вопросы:
- Когда Airflow vs cron
- dbt тесты: not_null, unique, accepted_values
- ClickHouse vs Postgres для аналитики
Подготовка: Airflow паттерны, ClickHouse и OLAP, Airflow на собесе DE, dbt тесты.
5. DE system design (60-90 минут)
Сценарии retail:
- «Пайплайн дневных продаж: 5k магазинов, час до открытия аналитического дашборда»
- «Real-time RecSys для Vprok: товары в корзине → рекомендации за 200ms»
- «Demand forecasting на 18000 SKU на 6 недель вперёд»
Что оценивают:
- Retail-специфика: SKU vs категории, иерархия магазинов / регионов
- Batch vs streaming trade-off
- Data modeling: fact_sales, dim_product, dim_store
- Slowly changing dimensions (товары приходят / уходят)
Подготовка: data modeling.
6. Поведенческое / фит
STAR. У X5 фокус:
- Опыт работы с большими таблицами (миллиарды строк)
- Как декомпозировал большой ETL-проект
- Конфликт с бизнесом по поводу требований
- Решение под deadline (вечер-к-утру)
Особенности направлений
| Направление | Стек / задачи |
|---|---|
| Analytics / BI | Airflow + dbt + ClickHouse, BI на Apache Superset / Tableau |
| Vprok (e-com) | Real-time для RecSys, классические e-com pipelines |
| Loyalty (Пятёрочка) | Customer 360°, retention аналитика |
| Supply Chain | Прогноз спроса, оптимизация заказов, инвентари |
| Pricing | Dynamic pricing pipelines, конкурентная аналитика |
| Data Platform | Внутренние data-tools |
Что X5 ценит в DE
- Retail mindset. Понимать различие SKU vs категории, hierarchy магазинов, SCD для товарного каталога
- SQL глубоко. В retail DE пишет SQL ежедневно, причём для бизнес-юзеров
- Production-mindset. Тесты ETL, dbt-тесты, мониторинг freshness
- Pragmatism. Не «идеальная архитектура за 6 месяцев», а «бизнес-результат за 3-4 недели»
- Domain-aware. Понимание категорий, магазинов, supply chain
Как готовиться: план
- SQL deep. Window functions, оптимизация, SCD типы.
- Airflow + dbt. Airflow на собесе DE, dbt тесты.
- ClickHouse. ClickHouse и OLAP subtopic.
- Data modeling. Star schema, dimensional modeling, SCD type 2.
- Retail-кейсы. Demand forecasting, RecSys для e-com, inventory.
- STAR-истории. Большие ETL-проекты, deadline-pressure.
Частые ошибки
- Игнор retail-специфики. «Сделаю как для соцсети» — не работает для SKU-driven данных
- Слабый SQL. В retail DE пишет SQL для бизнес-юзеров много, на больших таблицах
- Без dbt. Современный retail-стек требует dbt-подобной декларативной трансформации
- SCD не учитывается. Товарный каталог меняется постоянно (цены, описания). Без SCD type 2 — провал
- System design без масштаба. Решение для 100 магазинов не работает для 20k
Связанные темы
FAQ
Сколько раундов в X5 для DE?
Обычно 4-5: HR → SQL → coding → стек / system design → фит. Срок 3-5 недель.
Нужен ли retail-опыт?
Желательно, но не строго. Сильный DE без retail проходит, специфику можно подучить.
Какой основной стек?
Airflow + dbt + ClickHouse + Spark. В разных командах акцент разный.
Берут ли junior DE?
Через стажировки X5 Tech. Программы есть.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.