Собеседование на Data Scientist в СДЭК

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему СДЭК — особенный работодатель для DS

СДЭК — крупный российский логистический оператор. DS работает над прогнозом ETA, оптимизацией маршрутов, прогнозом нагрузки на ПВЗ и сортировочные центры, детекцией fraud (поддельные отправления), оптимизацией ценообразования для B2B.

Особенность: логистика — operational ML. Модели работают в режиме реального времени, влияют на физические процессы (где курьер, как маршрут), требуют интеграции с навигацией, OSM, time-series для прогноза нагрузки. Подробнее — на странице карьеры СДЭК.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30 минут)

Опыт, мотивация. Специфика:

  • Был ли опыт с time-series / прогнозированием / геоданными
  • Знание классического ML
  • Готовность работать с operational pipelines

2. SQL и Python (45-60 минут)

SQL — middle. Python — pandas, numpy. Для гео-задач могут попросить geopandas / shapely.

3. ML-теория (60-90 минут)

  • Classical ML: LR, GBM, ансамбли
  • Time series: ARIMA, Prophet, gradient boosting на лагах
  • Регрессия с категориальными (CatBoost)
  • Метрики regression: MAE, MAPE, SMAPE, RMSE
  • Optimization базовый: linear programming, VRP высокоуровнево

4. ML system design (60 минут)

«Спроектируй модель ETA-прогноза», «оптимизация маршрута курьера в городе», «прогноз нагрузки на ПВЗ на неделю».

5. Поведенческое (45 минут)

STAR-вопросы.

6. Финал

Технический + культурный.

Что СДЭК ценит в DS

  • Time-series навыки. Прогноз нагрузки, ARIMA, Prophet, gradient boosting на лагах.
  • Operational mindset. Модель не должна ломать pipeline, должна работать в SLA.
  • Геоданные. Понимание GIS, OSM, координат, расстояний.
  • Метрики regression. MAPE, WAPE, MAE, RMSE и когда что использовать.
  • Pragmatism. Чаще нужна простая модель, надёжно работающая в проде.

Типичные задачи и кейсы

  • «Спроектируй модель ETA для отправления по городу»
  • «Прогноз нагрузки на сортировочный центр на 7 дней»
  • «Оптимизация маршрута курьера: 30 точек, ограничения по времени»
  • «Детекция fraud: поддельные отправления при оплате наложкой»
  • «Динамическое ценообразование B2B: фичи, целевая, A/B-план»
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. Classical ML. Gradient boosting, регрессия с категориальными.
  2. Time series. ARIMA, Prophet, ML-подход (gradient boosting на лагах + календарных фичах).
  3. Метрики regression. MAE, MAPE, RMSE — когда что.
  4. GIS базовый. Координаты, расстояния, OSM.
  5. Optimization. Понимание VRP, linear programming высокоуровнево.

Частые ошибки

  • Игнорировать сезонность. В логистике праздники, распродажи и сезон сильно меняют нагрузку. Нужны календарные фичи.
  • Использовать MAPE на нулях. ETA не равно 0, но нагрузка по дням может быть. Используйте WAPE или SMAPE для устойчивости.
  • Сложная модель в реальном времени. Inference должен быть в миллисекундах. CatBoost > deep learning.
  • Игнорировать SLA. Модель, ошибающаяся на 10% от ETA — провал для пользователя.

Связанные темы

FAQ

Сколько этапов в собеседовании на DS в СДЭК?

Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 3-5 недель.

Нужен ли опыт в логистике?

Желателен, но не обязателен. Релевантным считается опыт с time-series, real-time ML, operational pipelines.

Какие алгоритмы спрашивают?

Time series (ARIMA, Prophet, gradient boosting на лагах). Classical ML. Метрики regression. GIS-задачи на конкретных командах.

Какой уровень SQL?

Уверенный middle.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.