Собеседование на Data Scientist в Магните
Содержание:
Почему Магнит — особенный работодатель для DS
Магнит — один из крупнейших российских ритейлеров. DS работает с гигантскими транзакционными данными (десятки миллионов чеков в день), лояльностью, ассортиментом, цепочками поставок. Главные ML задачи: прогноз спроса по SKU × магазин, RFM-сегментация лояльных клиентов, recsys в мобильном приложении, оптимизация маркетинговых акций.
Особенность: ритейл-DS — это операционный ML. Модели влияют на физические процессы (что заказать на склад, какую акцию запустить). Требования к стабильности, интерпретируемости. Подробнее — на странице карьеры Магнита.
Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.
Этапы собеседования
1. Скрининг с рекрутером (30 минут)
Опыт, мотивация. Специфика:
- Был ли опыт с retail / FMCG данными
- Знание классического ML + time series
- Готовность работать с большими объёмами
2. SQL и Python (60 минут)
SQL — middle-senior. Python — pandas, sklearn.
3. ML-теория (60-90 минут)
- Classical ML: gradient boosting
- Time series для прогноза спроса
- Recsys: collaborative, content-based
- Метрики regression: MAE, MAPE, WAPE
- RFM-сегментация
4. ML system design (60 минут)
«Прогноз спроса на 7 дней по SKU × магазин», «recsys в мобильном приложении», «scoring эффективности промо».
5. Поведенческое + финал
STAR + стратегический разговор.
Что Магнит ценит в DS
- Retail-domain. Понимание ассортимента, лояльности, цепочек.
- Time series. Прогноз спроса.
- Recsys. Collaborative, content-based.
- Метрики regression. MAE, MAPE, WAPE — когда что.
- Pragmatism. Простая модель в проде.
Типичные задачи и кейсы
- «Прогноз спроса на 7 дней по SKU × магазин»
- «RFM-сегментация: дизайн и валидация»
- «Recsys в мобильном приложении лояльности»
- «Scoring эффективности промо: до/после или uplift»
- «Дефицит товара: классификация причин (логистика / спрос)»
Как готовиться: план
- Classical ML. Gradient boosting.
- Time series. ARIMA, Prophet, ML на лагах.
- RFM. Сегментация, классификация.
- Recsys. Базовое.
- Метрики regression. MAE, MAPE, WAPE.
Частые ошибки
- MAPE на нулях. Спрос может быть 0 на SKU в магазине — WAPE надёжнее.
- Игнорировать сезонность. Праздники / акции / погода влияют на спрос.
- Сложная модель в реальном времени. Inference на десятки тысяч SKU должен быть быстрым.
- Не учитывать unit-эффект. Спрос на одном SKU зависит от наличия других.
Связанные темы
- Собеседование на DS в X5 Tech
- Собеседование на DS в Ozon
- Как посчитать MAPE в SQL
- Time series CV и features на собесе DS
- Собеседование на DE в Магните
FAQ
Сколько этапов в собеседовании на DS в Магните?
Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 4-6 недель.
Нужен ли ритейл-опыт?
Желателен. Релевантным считается e-com, FMCG.
Какой уровень SQL?
Уверенный middle-senior.
Спрашивают ли deep learning?
Редко. Главное classical ML + time series.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.