Собеседование на Data Scientist в Магните

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Магнит — особенный работодатель для DS

Магнит — один из крупнейших российских ритейлеров. DS работает с гигантскими транзакционными данными (десятки миллионов чеков в день), лояльностью, ассортиментом, цепочками поставок. Главные ML задачи: прогноз спроса по SKU × магазин, RFM-сегментация лояльных клиентов, recsys в мобильном приложении, оптимизация маркетинговых акций.

Особенность: ритейл-DS — это операционный ML. Модели влияют на физические процессы (что заказать на склад, какую акцию запустить). Требования к стабильности, интерпретируемости. Подробнее — на странице карьеры Магнита.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30 минут)

Опыт, мотивация. Специфика:

  • Был ли опыт с retail / FMCG данными
  • Знание классического ML + time series
  • Готовность работать с большими объёмами

2. SQL и Python (60 минут)

SQL — middle-senior. Python — pandas, sklearn.

3. ML-теория (60-90 минут)

  • Classical ML: gradient boosting
  • Time series для прогноза спроса
  • Recsys: collaborative, content-based
  • Метрики regression: MAE, MAPE, WAPE
  • RFM-сегментация

4. ML system design (60 минут)

«Прогноз спроса на 7 дней по SKU × магазин», «recsys в мобильном приложении», «scoring эффективности промо».

5. Поведенческое + финал

STAR + стратегический разговор.

Что Магнит ценит в DS

  • Retail-domain. Понимание ассортимента, лояльности, цепочек.
  • Time series. Прогноз спроса.
  • Recsys. Collaborative, content-based.
  • Метрики regression. MAE, MAPE, WAPE — когда что.
  • Pragmatism. Простая модель в проде.

Типичные задачи и кейсы

  • «Прогноз спроса на 7 дней по SKU × магазин»
  • «RFM-сегментация: дизайн и валидация»
  • «Recsys в мобильном приложении лояльности»
  • «Scoring эффективности промо: до/после или uplift»
  • «Дефицит товара: классификация причин (логистика / спрос)»
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. Classical ML. Gradient boosting.
  2. Time series. ARIMA, Prophet, ML на лагах.
  3. RFM. Сегментация, классификация.
  4. Recsys. Базовое.
  5. Метрики regression. MAE, MAPE, WAPE.

Частые ошибки

  • MAPE на нулях. Спрос может быть 0 на SKU в магазине — WAPE надёжнее.
  • Игнорировать сезонность. Праздники / акции / погода влияют на спрос.
  • Сложная модель в реальном времени. Inference на десятки тысяч SKU должен быть быстрым.
  • Не учитывать unit-эффект. Спрос на одном SKU зависит от наличия других.

Связанные темы

FAQ

Сколько этапов в собеседовании на DS в Магните?

Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 4-6 недель.

Нужен ли ритейл-опыт?

Желателен. Релевантным считается e-com, FMCG.

Какой уровень SQL?

Уверенный middle-senior.

Спрашивают ли deep learning?

Редко. Главное classical ML + time series.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.