Собеседование на Data Engineer в Wildberries

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему WB — особенный работодатель для DE

Wildberries — крупнейший российский маркетплейс (наряду с Ozon). Сотни миллионов SKU, тысячи ПВЗ, миллиарды событий в день. Стек: ClickHouse + Spark + Airflow + Kafka + Hadoop + собственные in-house tools. Объёмы данных растут лавинообразно.

DE в WB работает на высоких нагрузках. Особенно во время пиков (распродажи, BlackFriday) — pipelines под нагрузкой. Senior DE проектирует архитектуру и оптимизирует существующие pipelines.

Актуальные вакансии — на job.wildberries.ru.

Информация основана на публичных источниках и опыте кандидатов. Команды WB используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

1. HR-скрининг (30-45 минут)

Знакомство:

  • Стек: ClickHouse / Spark / Airflow / Kafka
  • Опыт с high-load и большими объёмами
  • Motivation: e-com / маркетплейс

Питч 90 секунд: продукт, объёмы, инструменты, impact.

2. SQL deep (60-90 минут)

В WB DE пишет много SQL. Глубина обязательна.

Темы:

  • Window functions, CTE, рекурсия
  • ClickHouse-specific: MergeTree, materialized views, dictionaries
  • Оптимизация
  • Дедупликация

Подготовка: SQL для DE, SQL-тренажёр.

3. Spark + Python (60-90 минут)

PySpark — основной distributed compute.

  • DataFrame API
  • Partitioning, shuffles, broadcast
  • Memory tuning

Подготовка: Spark deep dive.

4. System design (60-90 минут)

Кейсы:

  • Pipeline для inventory + sales
  • Recommendation pipeline
  • Pipeline антифрода
  • Аналитика для продавцов (B2B)

Подготовка: data modeling, Kafka streaming, CDC.

5. Поведенческое (45-60 минут)

STAR: high-load инциденты, peak season, missed deadlines.

Особенности по командам

Marketplace Core: product catalog, заказы, поиск.

Logistics / ПВЗ: интеграция со складами и ПВЗ.

B2B / Sellers: аналитика для продавцов.

ML / Ranking: recommendation, ranking, dynamic pricing.

Антифрод: real-time детект.

Что WB ценит в DE

  • SQL уверенно. ClickHouse-first стек.
  • Spark. Базовый билет.
  • High-load опыт. Понимание масштаба.
  • Reliability. Downtime в WB = большие убытки.
  • Pragmatism. Решения должны работать в проде.
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 4-6 недель:

  1. Неделя 1-2 — SQL + ClickHouse. SQL для DE, ClickHouse.
  2. Неделя 3 — Spark. Spark deep dive.
  3. Неделя 4 — System design. E-com кейсы. Kafka, CDC.
  4. Неделя 5 — Monitoring + cloud. мониторинг, cloud-стек.
  5. Неделя 6 — Mocks + behavioral.

Частые ошибки

  • Слабый ClickHouse. В WB CH-heavy.
  • Spark поверхностно. Без shuffle / partitioning — спросят и не ответишь.
  • Игнор e-com специфики. Не покажешь экспертизу.
  • Без peak-season опыта. BlackFriday / Распродажи — must упомянуть.
  • Без monitoring. Reliability — приоритет.

Связанные темы

FAQ

Удалёнка в WB для DE?

Гибрид часто.

Зарплатные вилки 2026?

Middle DE: 240-360k. Senior: 360-540k.

Английский нужен?

Не обязателен.

Сколько этапов?

4-5 этапов, 2-3 недели.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.