Собеседование на Data Scientist в Wildberries
Содержание:
Почему WB — особенный работодатель для DS
Wildberries — крупнейший российский маркетплейс. DS-команда работает над search ranking, рекомендациями (catalog, корзина, push), dynamic pricing, fraud detection, returns prediction, CV для модерации товаров. Объёмы данных — миллиарды событий в день.
Стек: Python + PyTorch + scikit-learn + LightGBM + Spark + ClickHouse + MLflow. WB активно инвестирует в ML-направление, команда быстро растёт.
Актуальные вакансии — на job.wildberries.ru.
Информация основана на публичных источниках и опыте кандидатов. Команды WB используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
1. HR-скрининг (30-45 минут)
Знакомство:
- Опыт ML, особенно e-com / маркетплейс
- Стек: PyTorch / sklearn / Spark
- Motivation
Питч 90 секунд: задача, данные, модель, метрика, impact.
2. ML теория (60-90 минут)
- Бустинги (XGBoost, CatBoost, LightGBM)
- Ranking metrics: NDCG, MAP, MRR
- Recommendation: CF, content-based, hybrid
- A/B-тесты ML моделей
Подготовка: ML-теория, A/B для DS.
3. Python + SQL (60-90 минут)
Live coding.
- Pandas / NumPy
- SQL window functions
- Алгоритмы medium
Подготовка: Python для DS.
4. ML System Design (60-90 минут)
Кейсы:
- Ranking для search
- Recommendation для homepage / корзины
- Dynamic pricing
- Returns prediction
Подготовка: ML system design, feature engineering.
5. Поведенческое (45-60 минут)
STAR: cross-team, high-load, ML in production.
Особенности по командам
Search & Ranking: core ranking, ML features.
Recommendations: carousel, homepage, push.
Pricing & Promo: dynamic pricing, promo-optimization.
Returns / Fraud: prediction возвратов и фрода.
B2B / Sellers: аналитика для продавцов.
Что WB ценит в DS
- Ranking / Recommendation опыт. Core для WB.
- A/B-тесты. Дизайн + analyse.
- Production ML. Не notebook-only.
- E-com domain. Sessions, conversion, AOV.
- High-load awareness. Pipeline должен переживать пики.
Как готовиться: план
За 4-6 недель:
- Неделя 1-2 — ML теория + Ranking. ML-теория.
- Неделя 3 — Python + SQL. Python для DS.
- Неделя 4 — System design. E-com. ML system design.
- Неделя 5 — A/B + production. A/B для DS.
- Неделя 6 — Mocks + behavioral.
Частые ошибки
- Без ranking опыта. WB core.
- «Только deep learning». LightGBM + features часто beats. Pragmatism.
- Без A/B понимания. Спросят дизайн.
- Игнор e-com специфики. Не покажешь экспертизу.
- Без production. Только эксперименты — слабо.
Связанные темы
- Собеседование на Data Scientist
- ML-теория на собесе DS
- ML system design
- Feature engineering
- A/B-тесты для DS
- Python для DS
FAQ
Удалёнка в WB для DS?
Гибрид часто.
Зарплатные вилки 2026?
Middle DS: 250-370k. Senior: 370-560k.
Английский нужен?
Базовый — желательно.
Сколько этапов?
4-5 этапов, 2-3 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.