Собеседование на Data Engineer в Лемана PRO

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Лемана PRO — особенный работодатель для DE

Лемана PRO (ранее Leroy Merlin в России) — крупнейшая сеть гипермаркетов DIY и товаров для дома: больше 100 гипермаркетов, специализированный e-com, программа лояльности, услуги от замеров до монтажа, сегмент B2B-PRO для мастеров и компаний. После смены акционера и ребрендинга компания активно инвестирует в собственный технологический стек и локализованную data-инфраструктуру. Для Data Engineer это специфический контекст: DIY-ритейл с сотнями тысяч SKU, длинными циклами покупок, заметной долей e-com, B2B-сегментом и активным переходом с международных систем Leroy Merlin Group на свои.

Главные DE-домены: построение DIY-DWH (миллионы чеков в день, сотни тысяч SKU, мастер-данные ассортимента, цен, поставщиков), интеграция данных проектов клиентов (CRM-проекты ремонта, услуги, замеры), e-com pipeline (онлайн-заказы, корзины, крупногабаритная доставка), B2B-PRO витрины (профессиональные клиенты с другим типом корзины и поведения), регуляторная отчётность (касса, НДС, маркировка ЧЗ), миграция legacy-систем Leroy Merlin Group на локальный стек, программа лояльности.

Стек: Greenplum как основной DWH + ClickHouse для real-time витрин и аналитики + PostgreSQL + Oracle как источники из core-систем; Airflow + dbt + Spark; Kafka + Debezium для CDC; data lake на S3-совместимых хранилищах + Iceberg; собственные инструменты + Grafana для observability. Заметная legacy-часть пришла из Leroy Merlin Group (кастомные ETL), активно мигрируется на современный стек. DE-команда заметно выросла за последние годы.

Актуальные вакансии — на hh.ru и сайте Лемана PRO.

Информация основана на публичных источниках и опыте кандидатов. Команды Лемана PRO используют разные процессы — формат и этапы зависят от направления и грейда, уточняйте у рекрутера.

Этапы собеседования

Полный цикл — 4-5 недель, 4-5 этапов. Процесс прагматичный, с упором на product-fit и опыт миграций: HR, техническое интервью, кодинг и SQL, продуктово-архитектурный кейс, финал.

1. HR-скрининг (30-45 минут)

Рекрутер уточняет: production-опыт DE (от 1.5-2 лет, желательно с ритейл-контекстом или большими миграциями), знание классического DWH и современного data stack, мотивацию идти в Лемана PRO с учётом активной локализации стека, ожидания по компенсации и формату (Москва, гибрид). Готовь питч на 90 секунд про самый зрелый production-pipeline.

2. Техническое интервью / SQL и архитектура (60-90 минут)

Базовая секция с senior DE из команды. Темы: SQL deep dive (оконные функции, рекурсивные CTE, оптимизация запросов, partitioning, индексы, EXPLAIN, MPP-специфика Greenplum), модели данных (звезда, снежинка, SCD типы, Data Vault), batch vs streaming, CDC (Debezium), data quality (тесты в dbt, Great Expectations), data lineage. Специфический вопрос: «как ты бы построил pipeline для синхронизации остатков между гипермаркетами и e-com хабами с учётом крупногабаритных товаров (ламинат, плитка)».

Подготовка: SQL для DE, Data modeling, CDC и event sourcing.

3. Python + SQL live coding (60 минут)

Задачи прагматичные: 1-2 на SQL (оконки, JOIN, оптимизация), 1-2 на Python (pandas, простые ETL, обработка CDC-events). Часто живой кейс: «дам тебе схему таблиц проектов и чеков B2B-PRO клиентов, посчитай средний чек по типам ремонта». Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.

Подготовка: SQL для DE.

4. Продуктово-архитектурный кейс (60-90 минут)

Самая характерная секция. Кейс архитектурный: «спроектируй pipeline для e-com доставки с интеграцией остатков 100+ гипермаркетов», «как ты бы построил витрину B2B-PRO клиентов с проектами ремонта», «как мигрировать legacy ETL Leroy Merlin Group на dbt + Airflow без простоя бизнеса». Нужно: уточнить требования, описать архитектуру, выбрать стек, продумать data quality и monitoring, обсудить миграционные риски и обратимость, заложить план рекавери. Сильный сигнал — учёт DIY-специфики: крупногабаритные товары, длинные циклы покупок, проектный контекст.

Подготовка: Airflow patterns, Monitoring и data quality.

5. Финал с тимлидом / руководителем направления (45 минут)

Беседа с тимлидом или руководителем. Проверяют поведенческие истории (STAR), отношение к корпоративной работе с категорийщиками и e-com, готовность к ответственности за миграционные проекты, обсуждают грейд и формат.

Особенности по командам

DWH и фактическая аналитика. Команда занимается построением и поддержкой DIY-DWH, мастер-данных ассортимента и цен. Стек — Greenplum + ClickHouse + Airflow + dbt + Spark. Челлендж — сотни тысяч SKU с длинными хвостами, мульти-канал (магазин + e-com + услуги), интеграция с legacy-системами. Подойдёт кандидатам с DWH-опытом и пониманием размерных моделей.

E-com и доставка DE. Команда занимается данными приложения, e-com заказов, маршрутизации крупногабаритной доставки, синхронизации остатков. Стек — Kafka + ClickHouse + dbt + кастомные стриминговые сервисы. Челлендж — синхронизация остатков между гипермаркетами и хабами доставки, специфика DIY-доставки (ламинат, плитка, мебель — другие правила, чем у Ozon). Подойдёт DE с опытом в e-com или real-time стек.

B2B-PRO витрины и проектные данные. Команда строит витрины для профессиональных клиентов: проекты ремонтов, услуги, lifecycle PRO-клиента. Стек — dbt + Greenplum + ClickHouse + интеграция с CRM. Челлендж — другая модель данных, чем у B2C; меньшая выборка, но более глубокая. Подойдёт DE с B2B-аналитикой или CRM-фоном.

Migration team (legacy → dbt+Airflow). Команда занимается миграцией legacy ETL Leroy Merlin Group на современный стек. Стек — dbt + Airflow + Python + legacy-системы как источники. Челлендж — параллельный запуск со сверкой эквивалентности результатов, обратимость, поддержка двух стеков. Подойдёт DE с зрелым ETL-фоном и терпением к интеграционной работе.

Регуляторная отчётность и маркировка. Команда отвечает за регулярные отчёты ФНС, отчётность по маркировке (ЧЗ), кассовые отчёты. Стек — dbt + Greenplum + специализированные интеграции с ФНС и ЦРПТ. Подойдёт DE с regulatory-опытом.

Что Лемана PRO ценит в DE

Production-опыт. Не Kaggle-experience, а pipeline в проде с SLA. «Сделал pipeline на Kaggle» — не история. «Запустил DWH-pipeline в гибридной среде legacy LM Group + новый стек с T+1 SLA и 99.9% доступностью» — это история.

Понимание DIY-специфики. Не обязательно работал в DIY, но базовое понимание (длинные циклы покупок, крупногабаритные товары, проектный характер ремонтов, B2C vs B2B-PRO) должно быть. На кейсе сразу видно.

Готовность к migration-работе. Лемана PRO активно мигрирует legacy. Кандидат, который любит «зелёное поле» и стартапы, в Лемана PRO будет страдать. Сильный — тот, кто получает удовольствие от reconciliation и поэтапной миграции.

Weak vs strong на архитектурном кейсе. Слабый ответ: «переедем legacy на dbt одним релизом, по выходным выкатываем». Сильный ответ: «миграция legacy ETL — это не одноразовый ивент. Поделю по доменам: первой мигрирую справочники (низкий риск, проверяю сверкой), потом базовые витрины (запуск параллельно, ежедневная reconciliation с legacy за 4 недели, потом переключение), потом сложные расчётные модели. На каждом шаге — обратимость и rollback-план. Streaming — не цель миграции, основной DWH остаётся batch».

Готовность к корпоративной среде. Лемана PRO — крупный международный ритейлер (с историей Leroy Merlin Group). Кандидат, который ругает «бюрократию» в принципе, рискует получить -1.

Self-management. Команды распределённые, проекты длинные. DE, который теряется без чёткого ТЗ, рассматривается слабее.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 4-6 недель до планируемого собеса:

  1. Неделя 1-2 — SQL deep dive и data modeling. Оконные функции, рекурсивные CTE, оптимизация запросов, partitioning, индексы, EXPLAIN. Модели данных (звезда, снежинка, SCD типы, Data Vault). Прорешай 30 SQL Medium-Hard задач. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день, чтобы за месяц освежить алгоритмы и метрики и не путаться на простых вопросах.
  2. Неделя 3 — Современный data stack и миграции. Airflow patterns, dbt (модели, тесты, snapshots), Spark (оптимизация, partitioning), Kafka + Debezium для CDC, миграционные паттерны (dual-write, change tracking, reconciliation).
  3. Неделя 4 — DIY и ритейл-контекст. Прочитай блоги X5 Tech, статьи про DIY-аналитику (HM, Amazon, IKEA), статьи про мульти-канальный ритейл. Запомни понятия: комплектность, проектный цикл, B2B-PRO, крупногабаритная доставка, длинный хвост SKU, omnichannel.
  4. Неделя 5 — Архитектурные кейсы. Прорешай 5-6 кейсов: e-com доставка с интеграцией остатков, B2B-PRO витрина, миграция legacy → dbt, синхронизация мульти-канала, маркировка ЧЗ. Структура — требования → источники → транспорт → процессинг → витрина → SLA → recovery. Airflow patterns.
  5. Неделя 6 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: миграционный проект, факап в проде, длинная интеграция, история про reconciliation и data quality.

Частые ошибки

Хайпуют стримингом и data lake. Кандидат предлагает заменить весь Greenplum на Iceberg + Trino. Не упоминает, что для основной аналитики Greenplum работает, и переезд это многолетний проект, не задача на собес.

Игнорируют DIY-специфику. Кандидат проектирует «как для FMCG-ритейла». В DIY длинные циклы, проектные покупки, крупногабаритная доставка — другие правила.

Не думают про reconciliation в миграции. Кандидат предлагает «переключиться разом». В Лемана PRO миграции идут с параллельным запуском и сверкой неделями.

Не разбираются в B2B-PRO сегменте. Кандидат, который не задаёт вопросы про PRO-клиентов, теряет балл. У них другая модель данных.

Не задают вопросы про объёмы и legacy. На кейсе сразу — стек, а не «сколько legacy-систем, какие источники, какие SLA, какие требования регуляторики». Это первый фильтр.

Связанные темы

FAQ

Удалёнка в Лемана PRO для DE?

Гибрид с офисом в Москве (Дербеневская набережная). Полная удалёнка возможна для senior+ при согласовании, но не правило.

Зарплатные вилки 2026?

Middle DE: 230-360k. Senior: 360-560k. Lead/Staff — выше, особенно в migration- и e-com направлениях. Бонусная схема привязана к KPI команды.

Нужен ли английский?

Базовый — для документации. Для работы с legacy LM Group или коммуникации с международными подрядчиками — желательнее, но не обязательно.

Сколько этапов?

4-5 этапов, 4-5 недель от первого скрининга до оффера. Без избыточных согласований, но локализация процессов после ребрендинга добавляет шаг.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.