Собеседование на Data Scientist в Лемана PRO

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Лемана PRO — особенный работодатель для DS

Лемана PRO — крупнейшая в России сеть гипермаркетов DIY и товаров для дома (ранее Leroy Merlin в России): больше 100 гипермаркетов, специализированный e-com, программа лояльности, услуги от замеров до монтажа. После смены акционера и ребрендинга компания активно инвестирует в собственный технологический стек и аналитику. Для Data Scientist это значит работу в DIY-ритейле, который похож на FMCG-сети по фичам, но имеет свою специфику: длинные циклы покупок (ремонт раз в N лет), широчайшая ассортиментная матрица (сотни тысяч SKU от шурупов до ламината), пересечение B2C и B2B (профессиональные покупатели — мастера и компании).

Главные ML-домены: прогноз спроса с учётом сезонности и проектного характера покупок, управление ассортиментом и closeout-моделирование, рекомендации в e-com и в магазине (включая «комплектные» — что докупить к ламинату), персонализация в карте лояльности, B2B-аналитика для PRO-сегмента (мастера, дизайнеры, маленькие компании), оптимизация логистики между гипермаркетами и хабами доставки. NLP-задачи — анализ отзывов и обращений, классификация поисковых запросов в e-com. CV — точечно, для контроля выкладки.

Стек: Python + Catboost + LightGBM + Prophet + scikit-learn; ClickHouse и Greenplum для аналитики; Airflow для пайплайнов; Spark для распределённых вычислений; MLflow или внутренние инструменты для трекинга. Часть наследия от Leroy Merlin Group — кастомные инструменты, которые сейчас переписываются под российскую инфраструктуру.

Актуальные вакансии — на hh.ru и сайте Лемана PRO.

Информация основана на публичных источниках и опыте кандидатов. Команды Лемана PRO используют разные процессы — формат и этапы зависят от направления и грейда, уточняйте у рекрутера.

Этапы собеседования

Полный цикл — 4-5 недель, 4-5 этапов. Процесс прагматичный, с упором на продуктовое мышление и DIY-специфику: HR, ML-теория, кодинг, продуктовый кейс, финал. Алгоритмическая планка средняя, без LeetCode Hard. На отдельных направлениях (B2B-PRO, проекты) может быть дополнительная секция с заказчиком.

1. HR-скрининг (30 минут)

Рекрутер уточняет: production-опыт ML (от 1 года, желательно с табличными данными), знание ритейл- или e-com-контекста, готовность работать в DIY-специфике (длинные циклы покупок, профессиональные клиенты), мотивацию идти именно в Лемана PRO, ожидания по компенсации и формату. Офис в Москве (Дербеневская набережная), часть команд работает гибридно. Готовь питч на 90 секунд: что делал, какие модели в проде, какой эффект на бизнес-метрику.

2. ML-теория (60-75 минут)

Базовая секция со старшим DS из направления. Темы: градиентный бустинг (Catboost/LightGBM — почему именно они, как обработать категориальные фичи большой размерности, регуляризация), классические методы (логистическая регрессия и её интерпретация, метрики классификации, ROC-AUC vs PR-AUC при дисбалансе), feature engineering для SKU большой ассортиментной матрицы, time-series (Prophet, ARIMA, методы прогноза проектных и сезонных продаж), эластичность спроса. DIY-специфика — длинные «холодные» периоды между покупками одного клиента, сильная сезонность ремонтных работ. Будь готов разобрать кейс «как ты бы предсказывал спрос на конкретный шуруп в конкретном магазине».

Подготовка: классическая ML, time series, feature engineering.

3. Python + SQL live coding (60 минут)

Задачи прагматичные: 1-2 на Python (структуры данных, простая динамика, работа с pandas), 1-2 на SQL (агрегаты, JOIN, оконные функции). Часто встречается живой кейс: «дам тебе фрейм с проектами клиентов из CRM, посчитай средний чек по типам ремонта». Без LeetCode Hard. Готовиться: 20-30 SQL-задач уровня Medium на оконки и JOIN + 30-50 простых задач на pandas.

Подготовка: live coding.

4. Кейс / Product Design (60-90 минут)

Основная ставка интервью. Кейс продуктовый или бизнес: «спроектируй систему рекомендаций для e-com, чтобы предложить клиенту, который купил ламинат, дополнительные товары», «как ты бы оценил эффект сезонной промо-кампании на категорию», «как сделать прогноз спроса для SKU с длинными периодами между покупками». Нужно: уточнить бизнес-метрику, описать данные (чеки, e-com, карта лояльности, проекты PRO-клиентов), выбрать модель и обосновать выбор, продумать пайплайн и cold-start стратегии, заложить мониторинг. Сильный сигнал — учёт «комплектности» покупки и проектного контекста («клиент делает ремонт ванной — нужны не отдельные SKU, а полный комплект»).

Подготовка: ML system design, метрики модели.

5. Финал с тимлидом / руководителем направления (45 минут)

Беседа с тимлидом или руководителем. Проверяют поведенческие истории (STAR), отношение к практической работе, готовность работать с бизнес-заказчиками и понимать DIY-контекст, обсуждают формат удалёнки и грейд. Здесь редко отказывают, но цифры могут поджать.

Особенности по командам

Прогноз спроса и assortment. Команда занимается прогнозом спроса по сотням тысяч SKU и оптимизацией ассортиментной матрицы по гипермаркетам. Стек — Python + Catboost + Prophet + Spark + ClickHouse. Главные челленджи: разреженный спрос для редких SKU, сезонность ремонтов (весна-осень), длинные хвосты. Подойдёт кандидатам с background в supply-chain forecasting или ритейл-DS.

E-com и рекомендации. Команда строит рекомендательные системы для онлайн-каталога и приложения: «к этому товару обычно покупают», «комплектные» рекомендации (полный набор для ванной), персонализация главной страницы. Стек — Python + двухбашенные сети + Catboost для ранжирования + ClickHouse. Челленджи — cold start (новые SKU, новые клиенты), комплектность (не отдельный товар, а набор), длинные циклы покупок (один клиент возвращается раз в год). Подойдёт DS с опытом recsys в e-com.

B2B / PRO-аналитика. Команда, занимающаяся профессиональными клиентами (мастера, маленькие строительные компании, дизайнеры): сегментация, прогноз LTV, персональные предложения, поддержка PRO-сервисов. Стек — Catboost + матричные методы + Greenplum. Челлендж — маленькая выборка (десятки тысяч PRO-клиентов), но средний чек на порядок выше B2C. Подойдёт кандидатам с опытом B2B-аналитики или CRM-сегментации.

Pricing и promo. Команда строит модели эластичности спроса и оценивает эффект промо-кампаний. Стек — Catboost + эконометрика. Челлендж — DIY-сегмент чувствительнее к цене, чем FMCG, но не на всех категориях (премиальные товары — наоборот). Подойдёт DS с эконометрическим бэкграундом или опытом в А/B-тестах.

Логистика и operations DS. Прогноз нагрузки на хабы доставки, оптимизация маршрутов крупногабаритной доставки (ламинат и плитка — не банка консервов), прогноз потерь и возвратов. Стек — Python + классический ML + OR-методы. Подойдёт кандидатам с математическим бэкграундом и интересом к operations.

Что Лемана PRO ценит в DS

Production-опыт. Не Kaggle-experience, а модель в проде с цифрами. «Сделал классификатор на Kaggle» — не история. «Запустил рекомендательную модель в e-com на 1М визитов в день, +1.8% средний чек в когортном тесте, прод на K8s» — это история.

Понимание DIY-специфики. Не обязательно работал в DIY, но базовое понимание (длинные циклы покупок, комплектные товары, проектный характер ремонтов, разница B2C и B2B-PRO) должно быть. На кейсе сразу видно, кто это понимает, а кто рассказывает про DIY как про FMCG.

Прагматизм. В Лемана PRO ценят «давай попробуем Catboost и matrix factorization», а не «возьмём огромную нейронку». Кандидат, который на System Design предлагает MLP на 50 фичах, получит -1.

Weak vs strong на System Design. Слабый ответ: «возьмём two-tower-модель для всех клиентов и всех SKU». Сильный ответ: «начну с item2item на корзинной co-occurrence — это работает уже сейчас. Для cold start новых SKU использую content-based на категориальных и текстовых фичах. PRO-клиентов отделю в отдельную модель — у них другая корзина и другой цикл покупок. Two-tower-сеть — только когда понадобится персонализация с глобальным контекстом, и при этом я заложу мониторинг доли „комплектных“ рекомендаций, потому что для DIY важна не точность top-1, а покрытие набора».

Готовность работать с бизнесом. DS в Лемана PRO плотно работает с категорийными менеджерами и e-com-продактами. Умение объяснить модель на бизнес-языке — ежедневная компетенция.

Скорость пилота. Лемана PRO активно перестраивает стек и любит быстрые пилоты. Кандидат, который месяц настраивает идеальный пайплайн без MVP, менее интересен, чем тот, кто за неделю выкатывает прототип.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 4-6 недель до планируемого собеса:

  1. Неделя 1-2 — Табличный ML и recsys-база. Catboost/LightGBM (категориальные фичи большой размерности, регуляризация), валидация для рядов (rolling-origin), Prophet и ARIMA, matrix factorization, item2item, базовые двухбашенные сети. Прорешай 1-2 кейса на Kaggle/HM/Amazon-данных. Параллельно — на Карьернике закрой пробелы по SQL, Python и базе ML: 1500+ задач, по 15-20 минут в день, за месяц обновишь все основы.
  2. Неделя 3 — DIY и e-com контекст. Прочитай блоги X5 Tech, Wildberries Tech, статьи про DIY-аналитику (HM, Amazon, IKEA). Запомни понятия: комплектность, проектный цикл, B2B-PRO-сегмент, сезонность ремонтов, длинный хвост SKU.
  3. Неделя 4 — Python + SQL live coding. 20-30 SQL-задач на оконки и JOIN, 30 задач на pandas (groupby, merge, time-windows).
  4. Неделя 5 — System Design кейсы. Прорешай 5-6 кейсов: прогноз спроса DIY, комплектные рекомендации, B2B-LTV для PRO, promo-эффект, логистика крупногабаритной доставки. Структура — бизнес → метрики → данные → модель → A/B → мониторинг. ML system design.
  5. Неделя 6 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: конфликт с категорийным менеджером, факап в проде, кейс с быстрым пилотом, история про обоснование простой модели вместо сложной.

Частые ошибки

Рассматривают DIY как FMCG. Кандидат строит модель прогноза спроса на ламинат, как на йогурт. Не учитывает, что покупки нерегулярные, цикл — годы, контекст — проект. Балл проседает.

Игнорируют комплектность покупки. В DIY клиент часто берёт «набор для ванной», а не отдельный кран. Рекомендации без понимания комплектности дают плохой результат. Если на кейсе кандидат не упоминает «комплектные» рекомендации — балл проседает.

Не разбираются в B2B-PRO-сегменте. Лемана PRO — это не только B2C. Кандидат, который не задаёт вопросы про PRO-клиентов, теряет балл. У них другая корзина, другой средний чек, другой канал.

Хайпуют сложными моделями. Кандидат предлагает Temporal Fusion Transformer для прогноза по 300 000 SKU. Не упоминает, что для DIY-сегмента простой матричный метод даёт сопоставимое качество за 1% от стоимости.

Не задают вопросы про данные. На кейсе сразу — модель, а не «что есть в чеках, в проектах PRO, в карте лояльности, какие пропуски». Это первый фильтр.

Связанные темы

FAQ

Удалёнка в Лемана PRO для DS?

Преимущественно гибрид с офисом в Москве (Дербеневская набережная). Полная удалёнка возможна точечно для senior+ при согласовании. Уточняйте на скрининге.

Зарплатные вилки 2026?

Middle DS: 230-360k. Senior: 360-550k. Lead/Staff — выше, особенно в направлениях e-com и pricing. Бонусная схема привязана к KPI команды.

Нужен ли английский?

Базовый — для документации и статей. Свободного говорящего не требуется, основная команда русскоязычная.

Сколько этапов?

4-5 этапов, 4-5 недель от первого скрининга до оффера. Без избыточных согласований, но локализация процессов после ребрендинга добавляет один шаг.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.