Собеседование на Data Scientist в X5
Содержание:
Почему X5 — особенный работодатель для DS
X5 Retail Group — крупнейший продуктовый ритейл РФ. DS-команда работает над прогнозированием спроса (по тысячам магазинов × сотням SKU), оптимизацией ассортимента, dynamic pricing, программой лояльности, ranking в e-com Vprok, persona-segmentation.
Стек: Python + scikit-learn + LightGBM + PyTorch + Spark + ClickHouse + MLflow. X5 Tech инвестирует в ML, команда активно растёт.
Актуальные вакансии — на job.x5.tech.
Информация основана на публичных источниках и опыте кандидатов. Команды X5 используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
1. HR-скрининг (30-45 минут)
Знакомство:
- Опыт ML, особенно в retail / e-com
- Стек: sklearn / LightGBM / Spark
- Motivation
Питч 90 секунд: задача, данные, модель, метрика, impact.
2. ML теория (60-90 минут)
- Классика: bias-variance, регуляризация
- Бустинги (XGBoost, CatBoost, LightGBM)
- Time-series forecasting
- Recommendation: CF, content-based
Подготовка: ML-теория, time-series.
3. Python + SQL (60-90 минут)
Live coding.
- Pandas / NumPy
- SQL window functions
- Алгоритмы medium
Подготовка: Python для DS.
4. ML System Design (60-90 минут)
Кейсы:
- Demand forecasting по магазинам × SKU
- Recommendation для Vprok / Перекрёсток
- Dynamic pricing
- Customer segmentation для лояльности
Подготовка: ML system design, feature engineering.
5. Поведенческое (45-60 минут)
STAR: ownership, cross-team, ML в проде.
Особенности по командам
Demand Forecast: прогноз по тысячам магазинов.
Pricing / Promo: dynamic pricing, promo optimization.
Vprok / E-com: recommendation, search ranking.
Лояльность / CRM: сегментация, churn.
Supply Chain: оптимизация запасов.
Что X5 ценит в DS
- ML фундамент. Бустинги, time-series.
- Retail domain. Понимание продуктового ритейла.
- SQL уверенно.
- Pragmatism. LightGBM + features часто beats deep.
- Production mindset.
Как готовиться: план
За 4-6 недель:
- Неделя 1-2 — ML теория + time-series. ML-теория, time-series.
- Неделя 3 — Python + SQL. Python для DS.
- Неделя 4 — System design. Retail. ML system design.
- Неделя 5 — A/B + production. A/B для DS.
- Неделя 6 — Mocks + behavioral.
Частые ошибки
- Без time-series понимания. Demand forecast — core.
- «Только deep learning». LightGBM beats.
- Слабый SQL.
- Без retail domain.
- Без production.
Связанные темы
- Собеседование на Data Scientist
- ML-теория на собесе DS
- Time-series на собесе
- ML system design
- Feature engineering
- A/B-тесты для DS
FAQ
Удалёнка в X5 для DS?
Гибрид часто.
Зарплатные вилки 2026?
Middle DS: 240-360k. Senior: 360-540k.
Английский нужен?
Не обязателен.
Сколько этапов?
4-5 этапов, 2-3 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.