Собеседование на Data Scientist в X5 Tech

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему X5 Tech — особенный работодатель для DS

X5 Tech — IT-направление крупнейшего ритейлера РФ (Пятёрочка, Перекрёсток, Чижик). DS-команды: прогноз спроса (replenishment, stock optimization), рекомендации (личные акции, программа лояльности «Х5 Клуб»), pricing (динамика цен, акции), CV (полки магазинов), supply chain optimization.

Особенность: ритейл — это огромная физическая сеть. ML-модели влияют на физические процессы: сколько товара заказать на склад, какую цену поставить, как разложить на полке. Цена ошибки — не «кликнули или нет», а реальные потери от overstock или stockout. Актуальные вакансии — на странице карьеры X5 Tech.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат собеседования отличается по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30 минут)

Опыт, мотивация. Особенности X5:

  • Опыт с ритейл-ML или прогнозом спроса
  • Знание classical ML на табличных данных
  • В какое направление интересно (replenishment / pricing / loyalty / CV)

2. SQL и Python (45-60 минут)

Live-coding: SQL на ритейл-данных (продажи по магазинам, retention карт лояльности), Python (pandas, ML pipeline).

3. ML-теория (60-90 минут)

Главный этап. Темы:

  • Прогноз временных рядов (ARIMA, Prophet, gradient boosting с lag features)
  • Gradient boosting (CatBoost — фаворит)
  • Метрики: MAPE, WAPE для прогноза. AUC / F1 для классификации
  • Сезонность, праздники, лаги
  • Recommender systems (для loyalty-команд)

4. ML system design (60 минут)

«Спроектируй модель прогноза спроса для FMCG», «recommender для персональных акций», «pricing для категории молочных».

5. Поведенческое (45 минут)

STAR-вопросы.

6. Финал с лидом

Стратегический разговор.

Что X5 Tech ценит в DS

  • Опыт с time series. Прогноз — главная задача
  • Понимание ритейла. Сезонность, праздники, региональная специфика
  • Бизнес-метрики. Точность модели важна, но цель — снижение stockout / overstock
  • Операционное мышление. Решения DS меняют физические процессы
  • Базовый ML. Gradient boosting глубоко, RNN/Transformer реже

Типичные задачи и кейсы

  • «Спроектируй модель прогноза спроса на молоко в Пятёрочке. Какие фичи, модель, валидация»
  • «WAPE модели прогноза 15%, бизнес хочет 10%. План улучшения?»
  • «Новый магазин: нет истории продаж. Как прогнозировать?»
  • «Спроектируй модель персональных акций для «Х5 Клуб»»
  • «Как замерить эффект скидки на конкретный товар в категории?»
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. Time series. Prophet, ARIMA, gradient boosting с lag features.
  2. Gradient boosting. CatBoost / LightGBM глубоко, feature engineering для табличных.
  3. Метрики time series. MAPE, WAPE, RMSE.
  4. Causal inference. Эффект акции — это causal inference, не correlation.
  5. SQL. Когорты, retention карт. SQL-раздел.
  6. STAR-истории. 6-8 готовых.

Частые ошибки

  • Игнорировать сезонность. В FMCG сезонность критична. Модель без неё — мусор
  • Не учитывать праздники. Новый год, Пасха, 23 февраля — отдельная история
  • Зубрить deep learning для time series. Часто gradient boosting лучше LSTM на табличных данных
  • Игнорировать ритейл-context. Промо, выкладка, региональная специфика
  • Слабый SQL. В ритейле много данных, без SQL не обойтись

Связанные темы

FAQ

Сколько этапов в собеседовании на DS в X5 Tech?

Обычно 4-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 3-5 недель.

Нужен ли ритейл-опыт?

Желателен. Если приходишь из других доменов — упор на понимание time series и operational ML.

Какие алгоритмы спрашивают?

Time series (Prophet, ARIMA, GBM с lag features) и classical ML (CatBoost / LightGBM). Deep learning — редко.

Спрашивают ли CV?

В CV-командах (полки магазинов) — да. В других — нет.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.