Собеседование на Data Scientist в X5 Tech
Содержание:
Почему X5 Tech — особенный работодатель для DS
X5 Tech — IT-направление крупнейшего ритейлера РФ (Пятёрочка, Перекрёсток, Чижик). DS-команды: прогноз спроса (replenishment, stock optimization), рекомендации (личные акции, программа лояльности «Х5 Клуб»), pricing (динамика цен, акции), CV (полки магазинов), supply chain optimization.
Особенность: ритейл — это огромная физическая сеть. ML-модели влияют на физические процессы: сколько товара заказать на склад, какую цену поставить, как разложить на полке. Цена ошибки — не «кликнули или нет», а реальные потери от overstock или stockout. Актуальные вакансии — на странице карьеры X5 Tech.
Информация в статье основана на публичных источниках и опыте кандидатов. Формат собеседования отличается по командам и грейдам. Уточняйте у рекрутера.
Этапы собеседования
1. Скрининг с рекрутером (30 минут)
Опыт, мотивация. Особенности X5:
- Опыт с ритейл-ML или прогнозом спроса
- Знание classical ML на табличных данных
- В какое направление интересно (replenishment / pricing / loyalty / CV)
2. SQL и Python (45-60 минут)
Live-coding: SQL на ритейл-данных (продажи по магазинам, retention карт лояльности), Python (pandas, ML pipeline).
3. ML-теория (60-90 минут)
Главный этап. Темы:
- Прогноз временных рядов (ARIMA, Prophet, gradient boosting с lag features)
- Gradient boosting (CatBoost — фаворит)
- Метрики: MAPE, WAPE для прогноза. AUC / F1 для классификации
- Сезонность, праздники, лаги
- Recommender systems (для loyalty-команд)
4. ML system design (60 минут)
«Спроектируй модель прогноза спроса для FMCG», «recommender для персональных акций», «pricing для категории молочных».
5. Поведенческое (45 минут)
STAR-вопросы.
6. Финал с лидом
Стратегический разговор.
Что X5 Tech ценит в DS
- Опыт с time series. Прогноз — главная задача
- Понимание ритейла. Сезонность, праздники, региональная специфика
- Бизнес-метрики. Точность модели важна, но цель — снижение stockout / overstock
- Операционное мышление. Решения DS меняют физические процессы
- Базовый ML. Gradient boosting глубоко, RNN/Transformer реже
Типичные задачи и кейсы
- «Спроектируй модель прогноза спроса на молоко в Пятёрочке. Какие фичи, модель, валидация»
- «WAPE модели прогноза 15%, бизнес хочет 10%. План улучшения?»
- «Новый магазин: нет истории продаж. Как прогнозировать?»
- «Спроектируй модель персональных акций для «Х5 Клуб»»
- «Как замерить эффект скидки на конкретный товар в категории?»
Как готовиться: план
- Time series. Prophet, ARIMA, gradient boosting с lag features.
- Gradient boosting. CatBoost / LightGBM глубоко, feature engineering для табличных.
- Метрики time series. MAPE, WAPE, RMSE.
- Causal inference. Эффект акции — это causal inference, не correlation.
- SQL. Когорты, retention карт. SQL-раздел.
- STAR-истории. 6-8 готовых.
Частые ошибки
- Игнорировать сезонность. В FMCG сезонность критична. Модель без неё — мусор
- Не учитывать праздники. Новый год, Пасха, 23 февраля — отдельная история
- Зубрить deep learning для time series. Часто gradient boosting лучше LSTM на табличных данных
- Игнорировать ритейл-context. Промо, выкладка, региональная специфика
- Слабый SQL. В ритейле много данных, без SQL не обойтись
Связанные темы
- Собеседование на Data Scientist
- Собеседование на DS в Ozon
- Time series decomposition
- Causal inference: причинность vs корреляция
- Cohort-анализ на собесе DS
FAQ
Сколько этапов в собеседовании на DS в X5 Tech?
Обычно 4-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 3-5 недель.
Нужен ли ритейл-опыт?
Желателен. Если приходишь из других доменов — упор на понимание time series и operational ML.
Какие алгоритмы спрашивают?
Time series (Prophet, ARIMA, GBM с lag features) и classical ML (CatBoost / LightGBM). Deep learning — редко.
Спрашивают ли CV?
В CV-командах (полки магазинов) — да. В других — нет.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.