Собеседование на Data Engineer в Lamoda
Содержание:
Почему Lamoda — особенный работодатель для DE
Lamoda — крупнейший fashion e-com СНГ. Десятки миллионов SKU, сезонные пики, fulfillment через собственную логистику и партнёров. Стек: Spark + Airflow + ClickHouse + PostgreSQL + Kafka. ML-команда работает с ranking, рекомендациями, dynamic pricing.
DE в Lamoda живёт между маркетинг-аналитикой, операционными pipelines и ML-командой. Уровень нагрузки — высокий, особенно во время распродаж (Black Friday, 11.11). Актуальные вакансии — на career.lamoda.tech.
Информация основана на публичных источниках и опыте кандидатов. Команды Lamoda используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
1. HR-скрининг (30-45 минут)
Знакомство:
- Стек: Spark / Airflow / ClickHouse / Kafka
- Опыт в e-com или маркетплейс
- Motivation: почему Lamoda
Питч 90 секунд: продукт, объёмы данных, инструменты, impact.
2. SQL deep dive (60-90 минут)
В Lamoda DE пишет много SQL для marts и аналитики. Глубина обязательна.
Темы:
- Window functions, CTE, оптимизация
- ClickHouse-specific: MergeTree, materialized views, dictionaries
- ETL-паттерны
- Дедупликация, late-arriving data
Подготовка: SQL для DE, SQL-тренажёр.
3. Spark + Python (60-90 минут)
PySpark — основной distributed compute.
Темы:
- DataFrame API, joins, aggregations
- Partitioning, shuffles, broadcast
- Memory tuning
- UDF и альтернативы
Подготовка: Spark deep dive.
4. System design (60-90 минут)
Кейсы:
- Pipeline для product analytics на Black Friday
- ML feature pipeline для recommendation
- Real-time inventory updates
- Data lake для возвратов и returns analytics
Подготовка: data modeling, dbt и моделирование.
5. Поведенческое + командное (45-60 минут)
STAR-истории про high-load инциденты, peak season пики, кросс-командные конфликты.
Особенности по командам
Core Marketplace: product catalog, поиск, фильтры. ClickHouse heavy.
Logistics: интеграция со складами, доставкой. Real-time tracking.
ML / Recommendations: feature engineering, ranking, A/B-тесты моделей.
Marketing Analytics: attribution, cohort analysis, CRM сегменты.
Pricing / Promo: dynamic pricing на ML, promo-аналитика.
Что Lamoda ценит в DE
- SQL + Spark уверенно. Базовый билет.
- ClickHouse. В Lamoda CH-heavy стек, без — слабо.
- E-com понимание. Sessions, conversion, returns, AOV.
- Reliability. На Black Friday downtime = большие деньги.
- Communication. Cross-team: marketing, ML, ops.
Как готовиться: план
За 4-6 недель:
- Неделя 1-2 — SQL + ClickHouse. Window functions, MergeTree, материализованные представления. SQL для DE, ClickHouse.
- Неделя 3 — Spark. PySpark, joins, shuffle. Spark deep dive.
- Неделя 4 — System design. E-com pipelines. data modeling, Kafka streaming.
- Неделя 5 — dbt + monitoring. dbt, мониторинг.
- Неделя 6 — Mocks + behavioral.
Частые ошибки
- Слабый ClickHouse. В Lamoda CH-heavy, без знания — провал.
- Spark поверхностно. Без shuffle / partitioning — спросят и не ответишь.
- Игнор e-com специфики. «Просто данные» — не покажешь домен-экспертизу.
- Без peak-season опыта. Не упомянуть Black Friday / high-load — слабая позиция.
- Без monitoring. Reliability — приоритет, спросят как.
Связанные темы
- Собеседование на Data Engineer
- SQL для DE
- Spark deep dive
- ClickHouse и OLAP
- dbt и моделирование
- Мониторинг и data quality
FAQ
Удалёнка в Lamoda для DE?
Гибрид часто. Полная удалёнка — реже.
Зарплатные вилки 2026?
Middle DE: 230-350k. Senior: 350-500k.
Английский нужен?
Базовый — желательно. Документация может быть на английском.
Сколько этапов?
4-5 этапов, 2-3 недели полный процесс.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.