Собеседование на Data Scientist в СДЭК
Содержание:
Почему СДЭК — особенный работодатель для DS
СДЭК — крупный российский логистический оператор. DS работает над прогнозом ETA, оптимизацией маршрутов, прогнозом нагрузки на ПВЗ и сортировочные центры, детекцией fraud (поддельные отправления), оптимизацией ценообразования для B2B.
Особенность: логистика — operational ML. Модели работают в режиме реального времени, влияют на физические процессы (где курьер, как маршрут), требуют интеграции с навигацией, OSM, time-series для прогноза нагрузки. Подробнее — на странице карьеры СДЭК.
Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.
Этапы собеседования
1. Скрининг с рекрутером (30 минут)
Опыт, мотивация. Специфика:
- Был ли опыт с time-series / прогнозированием / геоданными
- Знание классического ML
- Готовность работать с operational pipelines
2. SQL и Python (45-60 минут)
SQL — middle. Python — pandas, numpy. Для гео-задач могут попросить geopandas / shapely.
3. ML-теория (60-90 минут)
- Classical ML: LR, GBM, ансамбли
- Time series: ARIMA, Prophet, gradient boosting на лагах
- Регрессия с категориальными (CatBoost)
- Метрики regression: MAE, MAPE, SMAPE, RMSE
- Optimization базовый: linear programming, VRP высокоуровнево
4. ML system design (60 минут)
«Спроектируй модель ETA-прогноза», «оптимизация маршрута курьера в городе», «прогноз нагрузки на ПВЗ на неделю».
5. Поведенческое (45 минут)
STAR-вопросы.
6. Финал
Технический + культурный.
Что СДЭК ценит в DS
- Time-series навыки. Прогноз нагрузки, ARIMA, Prophet, gradient boosting на лагах.
- Operational mindset. Модель не должна ломать pipeline, должна работать в SLA.
- Геоданные. Понимание GIS, OSM, координат, расстояний.
- Метрики regression. MAPE, WAPE, MAE, RMSE и когда что использовать.
- Pragmatism. Чаще нужна простая модель, надёжно работающая в проде.
Типичные задачи и кейсы
- «Спроектируй модель ETA для отправления по городу»
- «Прогноз нагрузки на сортировочный центр на 7 дней»
- «Оптимизация маршрута курьера: 30 точек, ограничения по времени»
- «Детекция fraud: поддельные отправления при оплате наложкой»
- «Динамическое ценообразование B2B: фичи, целевая, A/B-план»
Как готовиться: план
- Classical ML. Gradient boosting, регрессия с категориальными.
- Time series. ARIMA, Prophet, ML-подход (gradient boosting на лагах + календарных фичах).
- Метрики regression. MAE, MAPE, RMSE — когда что.
- GIS базовый. Координаты, расстояния, OSM.
- Optimization. Понимание VRP, linear programming высокоуровнево.
Частые ошибки
- Игнорировать сезонность. В логистике праздники, распродажи и сезон сильно меняют нагрузку. Нужны календарные фичи.
- Использовать MAPE на нулях. ETA не равно 0, но нагрузка по дням может быть. Используйте WAPE или SMAPE для устойчивости.
- Сложная модель в реальном времени. Inference должен быть в миллисекундах. CatBoost > deep learning.
- Игнорировать SLA. Модель, ошибающаяся на 10% от ETA — провал для пользователя.
Связанные темы
- Собеседование на Data Scientist
- Time series CV и features на собесе DS
- Как посчитать MAPE в SQL
- ARIMA-прогнозирование
- Собеседование на DS в МТС
FAQ
Сколько этапов в собеседовании на DS в СДЭК?
Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 3-5 недель.
Нужен ли опыт в логистике?
Желателен, но не обязателен. Релевантным считается опыт с time-series, real-time ML, operational pipelines.
Какие алгоритмы спрашивают?
Time series (ARIMA, Prophet, gradient boosting на лагах). Classical ML. Метрики regression. GIS-задачи на конкретных командах.
Какой уровень SQL?
Уверенный middle.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.