Собеседование на ML Engineer в Mindbox

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Mindbox — особенный работодатель для MLE

Mindbox — российская CDP/CRM-маркетинговая платформа, один из лидеров рынка автоматизации маркетинга в России. Помогает компаниям (ритейл, e-commerce, банки, медиа) управлять данными клиентов, сегментировать аудиторию, автоматизировать email/SMS/push-рассылки, проводить A/B-тесты и personalization. Сотни B2B-клиентов, миллиарды коммуникаций ежемесячно. Для ML-инженера это работа в B2B SaaS с фокусом на customer analytics и marketing science.

ML-системы: customer segmentation (автоматическая сегментация клиентов по поведению), churn prediction (предсказание оттока для retention-кампаний), propensity-модели (вероятность покупки, конверсии), recommendation товаров и контента, NBO (Next Best Offer) с uplift modeling, anti-spam в коммуникациях. Особенность Mindbox — мультитенантная платформа: модели работают на данных разных клиентов с разными distributions.

Стек: Python + Catboost для табличных задач + PyTorch для нейросетей + K8s для deployment + ClickHouse как аналитический движок + MLflow для трекинга экспериментов.

Актуальные вакансии — на hh.ru и сайте Mindbox.

Информация основана на публичных источниках и опыте кандидатов. Команды Mindbox используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

Цикл занимает 3-4 недели и включает 5-6 этапов. Mindbox — продвинутая B2B SaaS-компания с сильной ML-культурой. Упор на marketing ML и uplift modeling.

1. HR-скрининг (30-45 минут)

Рекрутер проверяет фон: production-опыт ML, CDP / CRM / маркетинг ML background — плюс. Готовь питч 90 секунд. Если работал в marketing-tech, CRM, recsys в ритейле — упомяни сразу.

2. ML-теория (60-90 минут)

Базовая секция. Темы: градиентный бустинг (CatBoost), churn / propensity-модели, uplift modeling (S-learner, T-learner, X-learner, causal forests), recommendation. Будь готов про A/B-тестирование, causal inference.

Подготовка: ML-теория.

3. Python live coding (60 минут)

Live-кодинг: 1-2 задачи на алгоритмы (LeetCode Medium), плюс задача на ML-pipeline — реализовать Qini-кривую для uplift, sampling negative samples в recsys. Готовиться по LeetCode минимум 3-4 недели.

Подготовка: Python для DS.

4. ML System Design (90 минут)

Кейсовая секция. Кейсы: «churn prediction pipeline для B2B-клиентов», «recommendation товаров с учётом sequential behavior», «NBO uplift modeling с holdout». Нужно: уточнить бизнес-метрику (revenue lift, не accuracy), описать архитектуру для multi-tenant.

Подготовка: MLOps, Model serving, Feature stores.

5. Production / scale (60 минут)

Секция про инфраструктуру: K8s deployment, мониторинг, обработка multi-tenant нагрузки. Кейсы про откат, drift, инциденты с одним клиентом, не задевающие других.

Подготовка: Monitoring drift, Deployment strategies.

6. Поведенческое (45 минут)

С тимлидом. STAR-формат. Mindbox ценит ownership, инициативу, понимание marketing-домена.

Особенности по командам

Segmentation ML. Автоматическая сегментация клиентов на основе поведения, RFM-расширения, ML-сегменты. Командой делает custom-сегментацию для крупных клиентов и universal-сегментацию из коробки.

Churn / Retention ML. Churn prediction с горизонтом 30/60/90 дней, propensity для re-engagement. ML-driven CRM.

Recommendation. Recsys товаров (для e-commerce клиентов), контента (для медиа), sequential модели. Подойдёт MLE с recsys-опытом.

NBO / Uplift. Самая интересная для Mindbox команда: Next Best Offer с uplift modeling — какой оффер действительно увеличит конверсию у конкретного клиента (не просто скрининг high-propensity, а true causal effect). Подойдёт MLE с causal inference background.

Anti-spam. Защита коммуникаций от спама, контроль качества рассылок. ML-classification.

Что Mindbox ценит в MLE

Production ML. Базовое требование. Слабый — «делал на Kaggle»; сильный — «uplift-модель для retention-кампании, +12% revenue lift в treated cohort, deploy через K8s».

CDP / CRM context. Понимание customer-data платформ: heterogeneity, multi-tenancy, privacy. Если в marketing-tech не работал — изучи блоги Segment, Adobe.

Uplift / propensity. Слабый — «делал propensity»; сильный — «использовал S/T/X-learners, оценивал Qini-coefficient, проектировал holdout для measurement».

K8s. Без K8s сложно.

Catboost / PyTorch / Python. Стандарт.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 6-8 недель до собеседования:

  1. Неделя 1-2 — Python + ML + uplift. LeetCode Medium 30+ задач, uplift modeling, causal inference. Параллельно прорешай вопросы по Python, ML и SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. Python для DS, ML-теория.
  2. Неделя 3 — K8s + Docker. Подними хотя бы 1 модель в K8s.
  3. Неделя 4 — MLOps + feature stores. MLOps, Feature stores.
  4. Неделя 5 — System design + CRM ML. Кейсы churn, recommendation, uplift. Model serving.
  5. Неделя 6 — Monitoring + deployment. Monitoring drift.
  6. Неделя 7-8 — Mocks + behavioral. Mock-интервью, 5-7 STAR-историй.

Частые ошибки

Без CDP / CRM domain. Кандидат говорит «у меня e-commerce» — может пройти, но без понимания multi-tenant специфики отвалится. Сильный — «понимаю customer-data платформы, mulit-tenant constraints».

Без uplift modeling. Кандидат говорит «делал propensity» — для NBO-команды слабо. Сильный — «использовал meta-learners, проектировал holdout, измерял Qini-coefficient».

Без K8s. «Деплоил через docker-compose» — слабо. Сильный — «деплоил через K8s».

Только notebook. Кандидаты с Jupyter-only валятся. Сильный — «свои проекты переписал в виде пакетов».

Без production опыта. «У нас была модель» — не история. Сильный — «uplift-модель для retention, +12% revenue lift, мониторил эффект через causal A/B».

Связанные темы

FAQ

Удалёнка в Mindbox для MLE?

Часто полная удалёнка.

Зарплатные вилки 2026?

Middle MLE: 300-450k. Senior: 450-670k.

Английский нужен?

Базовый — желательно.

Сколько этапов?

5-6 этапов, 3-4 недели.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.