13 мая 2026 г.·4 мин чтения

Собеседование на Data Scientist в X5 Tech

Проверь себя · 1/3разбор после ответа

Аналитик сравнивает распределения времени отклика двух серверов и замечает, что у одного эксцесс (kurtosis) значительно выше. Что это говорит о данных?

Содержание:

Почему X5 Tech — особенный работодатель для DS
Этапы собеседования
Что X5 Tech ценит в DS
Типичные задачи и кейсы
Как готовиться: план
Частые ошибки
Связанные темы
FAQ

Почему X5 Tech — особенный работодатель для DS

X5 Tech — IT-направление крупнейшего ритейлера РФ (Пятёрочка, Перекрёсток, Чижик). DS-команды: прогноз спроса (replenishment, stock optimization), рекомендации (личные акции, программа лояльности «Х5 Клуб»), pricing (динамика цен, акции), CV (полки магазинов), supply chain optimization.

Особенность: ритейл — это огромная физическая сеть. ML-модели влияют на физические процессы: сколько товара заказать на склад, какую цену поставить, как разложить на полке. Цена ошибки — не «кликнули или нет», а реальные потери от overstock или stockout. Актуальные вакансии — на странице карьеры X5 Tech.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат собеседования отличается по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30 минут)

Опыт, мотивация. Особенности X5:

Опыт с ритейл-ML или прогнозом спроса
Знание classical ML на табличных данных
В какое направление интересно (replenishment / pricing / loyalty / CV)

2. SQL и Python (45-60 минут)

Live-coding: SQL на ритейл-данных (продажи по магазинам, retention карт лояльности), Python (pandas, ML pipeline).

3. ML-теория (60-90 минут)

Главный этап. Темы:

Прогноз временных рядов (ARIMA, Prophet, gradient boosting с lag features)
Gradient boosting (CatBoost — фаворит)
Метрики: MAPE, WAPE для прогноза. AUC / F1 для классификации
Сезонность, праздники, лаги
Recommender systems (для loyalty-команд)

4. ML system design (60 минут)

«Спроектируй модель прогноза спроса для FMCG», «recommender для персональных акций», «pricing для категории молочных».

5. Поведенческое (45 минут)

STAR-вопросы.

6. Финал с лидом

Стратегический разговор.

Что X5 Tech ценит в DS

Опыт с time series. Прогноз — главная задача
Понимание ритейла. Сезонность, праздники, региональная специфика
Бизнес-метрики. Точность модели важна, но цель — снижение stockout / overstock
Операционное мышление. Решения DS меняют физические процессы
Базовый ML. Gradient boosting глубоко, RNN/Transformer реже

Типичные задачи и кейсы

«Спроектируй модель прогноза спроса на молоко в Пятёрочке. Какие фичи, модель, валидация»
«WAPE модели прогноза 15%, бизнес хочет 10%. План улучшения?»
«Новый магазин: нет истории продаж. Как прогнозировать?»
«Спроектируй модель персональных акций для «Х5 Клуб»»
«Как замерить эффект скидки на конкретный товар в категории?»

Готовься к собесу аналитика как в Duolingo

10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram

Открыть Карьерник в Telegram

Как готовиться: план

Time series. Prophet, ARIMA, gradient boosting с lag features.
Gradient boosting. CatBoost / LightGBM глубоко, feature engineering для табличных.
Метрики time series. MAPE, WAPE, RMSE.
Causal inference. Эффект акции — это causal inference, не correlation.
SQL. Когорты, retention карт. SQL-раздел.
STAR-истории. 6-8 готовых.

Частые ошибки

Игнорировать сезонность. В FMCG сезонность критична. Модель без неё — мусор
Не учитывать праздники. Новый год, Пасха, 23 февраля — отдельная история
Зубрить deep learning для time series. Часто gradient boosting лучше LSTM на табличных данных
Игнорировать ритейл-context. Промо, выкладка, региональная специфика
Слабый SQL. В ритейле много данных, без SQL не обойтись

Связанные темы

FAQ

Сколько этапов в собеседовании на DS в X5 Tech?

Обычно 4-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 3-5 недель.

Нужен ли ритейл-опыт?

Желателен. Если приходишь из других доменов — упор на понимание time series и operational ML.

Какие алгоритмы спрашивают?

Time series (Prophet, ARIMA, GBM с lag features) и classical ML (CatBoost / LightGBM). Deep learning — редко.

Спрашивают ли CV?

В CV-командах (полки магазинов) — да. В других — нет.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.