Собеседование на Data Engineer в Wildberries
Содержание:
Почему WB — особенный работодатель для DE
Wildberries — крупнейший российский маркетплейс (наряду с Ozon). Сотни миллионов SKU, тысячи ПВЗ, миллиарды событий в день. Стек: ClickHouse + Spark + Airflow + Kafka + Hadoop + собственные in-house tools. Объёмы данных растут лавинообразно.
DE в WB работает на высоких нагрузках. Особенно во время пиков (распродажи, BlackFriday) — pipelines под нагрузкой. Senior DE проектирует архитектуру и оптимизирует существующие pipelines.
Актуальные вакансии — на job.wildberries.ru.
Информация основана на публичных источниках и опыте кандидатов. Команды WB используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
1. HR-скрининг (30-45 минут)
Знакомство:
- Стек: ClickHouse / Spark / Airflow / Kafka
- Опыт с high-load и большими объёмами
- Motivation: e-com / маркетплейс
Питч 90 секунд: продукт, объёмы, инструменты, impact.
2. SQL deep (60-90 минут)
В WB DE пишет много SQL. Глубина обязательна.
Темы:
- Window functions, CTE, рекурсия
- ClickHouse-specific: MergeTree, materialized views, dictionaries
- Оптимизация
- Дедупликация
Подготовка: SQL для DE, SQL-тренажёр.
3. Spark + Python (60-90 минут)
PySpark — основной distributed compute.
- DataFrame API
- Partitioning, shuffles, broadcast
- Memory tuning
Подготовка: Spark deep dive.
4. System design (60-90 минут)
Кейсы:
- Pipeline для inventory + sales
- Recommendation pipeline
- Pipeline антифрода
- Аналитика для продавцов (B2B)
Подготовка: data modeling, Kafka streaming, CDC.
5. Поведенческое (45-60 минут)
STAR: high-load инциденты, peak season, missed deadlines.
Особенности по командам
Marketplace Core: product catalog, заказы, поиск.
Logistics / ПВЗ: интеграция со складами и ПВЗ.
B2B / Sellers: аналитика для продавцов.
ML / Ranking: recommendation, ranking, dynamic pricing.
Антифрод: real-time детект.
Что WB ценит в DE
- SQL уверенно. ClickHouse-first стек.
- Spark. Базовый билет.
- High-load опыт. Понимание масштаба.
- Reliability. Downtime в WB = большие убытки.
- Pragmatism. Решения должны работать в проде.
Как готовиться: план
За 4-6 недель:
- Неделя 1-2 — SQL + ClickHouse. SQL для DE, ClickHouse.
- Неделя 3 — Spark. Spark deep dive.
- Неделя 4 — System design. E-com кейсы. Kafka, CDC.
- Неделя 5 — Monitoring + cloud. мониторинг, cloud-стек.
- Неделя 6 — Mocks + behavioral.
Частые ошибки
- Слабый ClickHouse. В WB CH-heavy.
- Spark поверхностно. Без shuffle / partitioning — спросят и не ответишь.
- Игнор e-com специфики. Не покажешь экспертизу.
- Без peak-season опыта. BlackFriday / Распродажи — must упомянуть.
- Без monitoring. Reliability — приоритет.
Связанные темы
- Собеседование на Data Engineer
- SQL для DE
- Spark deep dive
- ClickHouse и OLAP
- Kafka streaming
- Мониторинг и data quality
FAQ
Удалёнка в WB для DE?
Гибрид часто.
Зарплатные вилки 2026?
Middle DE: 240-360k. Senior: 360-540k.
Английский нужен?
Не обязателен.
Сколько этапов?
4-5 этапов, 2-3 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.