Собеседование на Data Engineer в Ашан
Содержание:
Почему Ашан — особенный работодатель для DE
Ашан — международная розничная сеть в России: десятки гипермаркетов и супермаркетов, программа лояльности «Бонус», e-com и доставка через приложение, активная адаптация стека под локальный рынок. Для Data Engineer это интересное место: с одной стороны — международное наследие в архитектуре и процессах (стандарты Auchan Group), с другой — заметная локализация и активные миграции legacy на современный стек. Команда меньше, чем у Магнита или X5, что даёт больше владения проектами «от и до».
Главные DE-домены: построение чек-DWH (миллионы чеков в день по десяткам гипермаркетов и форматам поменьше), мастер-данные ассортимента, цен и поставщиков, pipeline для прогноза спроса и assortment-rebalancing между форматами, CRM-витрины и программа лояльности, e-com pipeline (онлайн-заказы и доставка), регуляторная отчётность (касса, НДС, маркировка ЧЗ), миграция legacy ETL из Auchan Group на современный локальный стек.
Стек: Greenplum как основной DWH + ClickHouse для real-time и аналитики + Oracle/MS SQL как источники из core-систем; Airflow + dbt + Spark; Kafka + Debezium для CDC; data lake на S3-совместимых хранилищах; собственные инструменты + Grafana для observability. Часть legacy пришла из Auchan Group (кастомные ETL), активно мигрируется на локальный стек.
Актуальные вакансии — на hh.ru и сайте Ашана.
Информация основана на публичных источниках и опыте кандидатов. Команды Ашана используют разные процессы — формат и этапы зависят от направления и грейда, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 4-5 недель, 4-5 этапов. Процесс прагматичный: HR, техническое интервью, кодинг и SQL, продуктово-архитектурный кейс, финал. Алгоритмическая планка средняя, без LeetCode Hard.
1. HR-скрининг (30-45 минут)
Рекрутер уточняет: production-опыт DE (от 1.5-2 лет, желательно с ритейл-контекстом), знание классического DWH и современного data stack, мотивацию идти в Ашан, ожидания по компенсации и формату (Москва, гибрид). Готовь питч на 90 секунд про самый зрелый production-pipeline.
2. Техническое интервью / SQL и архитектура (60-90 минут)
Базовая секция с senior DE из команды. Темы: SQL deep dive (оконные функции, рекурсивные CTE, оптимизация, partitioning, индексы, EXPLAIN, MPP-специфика Greenplum), модели данных (звезда, снежинка, SCD типы, Data Vault), batch vs streaming, CDC (Debezium), data quality (тесты в dbt, Great Expectations), data lineage. Специфический вопрос: «как ты бы построил pipeline для прогноза спроса с учётом двух форматов магазинов».
Подготовка: SQL для DE, Data modeling, dbt и моделирование.
3. Python + SQL live coding (60 минут)
Задачи прагматичные: 1-2 на SQL (оконки, JOIN, оптимизация на больших таблицах), 1-2 на Python (pandas, простые ETL). Часто живой кейс: «дам тебе схему чеков и категорийной матрицы, посчитай средний чек по топ-10 категориям с разбивкой по форматам». Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.
Подготовка: SQL для DE.
4. Продуктово-архитектурный кейс (60-90 минут)
Самая характерная секция. Кейс архитектурный: «спроектируй pipeline для прогноза спроса с учётом двух форматов магазинов», «как ты бы построил CDC из POS-систем разных поколений», «как мигрировать legacy ETL Auchan Group на dbt без простоя бизнеса». Нужно: уточнить требования, описать архитектуру, выбрать стек и обосновать, продумать data quality и monitoring, обсудить trade-off и миграционные риски, заложить план рекавери. Сильный сигнал — учёт мульти-формата и международного наследия процессов.
Подготовка: Airflow patterns, Monitoring и data quality.
5. Финал с тимлидом / руководителем направления (45 минут)
Беседа с тимлидом или руководителем. Проверяют поведенческие истории (STAR), отношение к корпоративной работе, готовность к миграционным проектам, обсуждают грейд.
Особенности по командам
DWH и фактическая аналитика. Команда занимается построением и поддержкой чек-DWH, мастер-данных ассортимента и цен. Стек — Greenplum + ClickHouse + Airflow + dbt + Spark. Челлендж — мульти-формат (гипермаркет vs формат поменьше), интеграция legacy-источников. Подойдёт кандидатам с DWH-опытом и пониманием размерных моделей.
Прогноз спроса и assortment-pipeline. Команда строит pipeline для прогноза спроса по форматам и feature engineering для ML-моделей. Стек — Spark + Python + dbt + Greenplum. Челлендж — разные паттерны спроса по форматам, длинные хвосты SKU, train-serving consistency. Подойдёт DE с background в supply-chain analytics.
CRM и программа лояльности. Команда строит витрины программы лояльности «Бонус»: миллионы клиентов, поведенческие сигналы, сегментация. Стек — dbt + Greenplum + ClickHouse + Airflow + интеграция с CDP. Подойдёт DE с опытом в CRM или CDP.
E-com и доставка DE. Команда занимается данными приложения и онлайн-заказов, синхронизации остатков, маршрутизации. Стек — Kafka + ClickHouse + dbt + кастомные стриминговые сервисы. Подойдёт DE с опытом в e-com.
Migration team (legacy → dbt+Airflow). Команда занимается миграцией legacy ETL из Auchan Group на современный стек. Стек — dbt + Airflow + Python + legacy-системы как источники. Челлендж — параллельный запуск со сверкой эквивалентности, обратимость. Подойдёт DE с зрелым ETL-фоном.
Что Ашан ценит в DE
Production-опыт. Не Kaggle-experience, а pipeline в проде с SLA. «Запустил DWH-pipeline в гибридной среде legacy + новый стек с T+1 SLA и 99.9% доступностью» — это история.
Понимание ритейл-бизнеса. Базовые понятия (SKU, ассортиментная матрица, out-of-stock, маржа, оборот, оборачиваемость, корзина, формат магазина) должны быть знакомы.
Готовность к миграционной работе. Ашан активно мигрирует legacy. Кандидат, который любит «зелёное поле», в Ашане будет страдать. Сильный — тот, кто получает удовольствие от reconciliation и поэтапной миграции.
Weak vs strong на архитектурном кейсе. Слабый ответ: «переедем legacy на dbt за один релиз». Сильный ответ: «миграция — это не одноразовый ивент. Поделю по доменам: справочники первыми (низкий риск), потом базовые витрины (параллельный запуск, daily reconciliation с legacy за 4 недели), потом сложные расчётные модели. На каждом шаге — обратимость и rollback-план. Для мульти-формата — conformed dimensions для SKU и format-specific атрибуты в дополнительных таблицах».
Готовность к международной корпоративной среде. Ашан — часть международной группы Auchan. Стандарты группы есть. Кандидат, который ругает «корпоративные стандарты» вообще, рискует.
Self-management. Команды распределённые. DE, который теряется без ежедневной обратной связи, рассматривается слабее.
Как готовиться: план
За 4-6 недель до планируемого собеса:
- Неделя 1-2 — SQL deep dive и data modeling. Оконные функции, рекурсивные CTE, оптимизация запросов, partitioning, индексы, EXPLAIN. Модели данных (звезда, снежинка, SCD типы, Data Vault). Прорешай 30 SQL Medium-Hard задач. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день, за месяц закроешь пробелы и не будешь путаться на простых вопросах.
- Неделя 3 — Современный data stack и миграции. Airflow patterns, dbt, Spark (оптимизация, partitioning), Kafka + Debezium для CDC, миграционные паттерны (dual-write, change tracking, reconciliation).
- Неделя 4 — Ритейл-контекст. Прочитай блоги X5 Tech, Wildberries Tech, статьи по retail-DWH и мульти-формату. Запомни понятия: SKU, ассортиментная матрица, out-of-stock, оборачиваемость, формат магазина, conformed dimension, маркировка ЧЗ.
- Неделя 5 — Архитектурные кейсы. Прорешай 5-6 кейсов: чек-DWH с мульти-форматом, CDC с разных POS, миграция legacy ETL → dbt, single customer view, e-com доставка. Структура — требования → источники → транспорт → процессинг → витрина → SLA → recovery. Airflow patterns.
- Неделя 6 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: миграционный проект, факап в проде, длинная интеграция, история про reconciliation и data quality.
Частые ошибки
Хайпуют стримингом везде. Кандидат проектирует чек-DWH как pure streaming. Не упоминает, что для аналитики batch с T+1 достаточно, streaming оставляется для real-time-кейсов.
Игнорируют мульти-формат. Кандидат проектирует «как для одного формата». Ашан — это разные форматы с разной экономикой и моделью данных.
Не думают про reconciliation в миграции. Кандидат предлагает «переключиться разом». В Ашане миграции идут параллельным запуском со сверкой.
Не разбираются в ритейл-метриках. «Что такое оборачиваемость, ABC-анализ, out-of-stock?» — кандидат теряется.
Не задают вопросы про legacy и SLA. На кейсе сразу — стек, а не «сколько legacy-систем, какие SLA, какие требования группы Auchan». Это первый фильтр.
Связанные темы
- Собеседование на Data Engineer
- SQL для DE
- dbt и моделирование
- Собеседование на Data Engineer в Магнит
- Собеседование на Data Scientist в Ашан
FAQ
Удалёнка в Ашане для DE?
Гибрид с офисом в Москве. Полная удалёнка возможна точечно для senior+ при согласовании. Часть команд работает в распределённом формате.
Зарплатные вилки 2026?
Middle DE: 230-360k. Senior: 360-560k. Lead/Staff — выше, особенно в DWH- и migration-направлениях. Бонусная схема привязана к KPI команды и группы.
Нужен ли английский?
Базовый — для документации и коммуникации с командами группы Auchan на отдельных проектах. Свободного говорящего не требуется.
Сколько этапов?
4-5 этапов, 4-5 недель от первого скрининга до оффера. Без избыточных согласований, но международная отчётность может добавить шаг.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.