Собеседование на ML Engineer в Mindbox
Содержание:
Почему Mindbox — особенный работодатель для MLE
Mindbox — российская CDP/CRM-маркетинговая платформа, один из лидеров рынка автоматизации маркетинга в России. Помогает компаниям (ритейл, e-commerce, банки, медиа) управлять данными клиентов, сегментировать аудиторию, автоматизировать email/SMS/push-рассылки, проводить A/B-тесты и personalization. Сотни B2B-клиентов, миллиарды коммуникаций ежемесячно. Для ML-инженера это работа в B2B SaaS с фокусом на customer analytics и marketing science.
ML-системы: customer segmentation (автоматическая сегментация клиентов по поведению), churn prediction (предсказание оттока для retention-кампаний), propensity-модели (вероятность покупки, конверсии), recommendation товаров и контента, NBO (Next Best Offer) с uplift modeling, anti-spam в коммуникациях. Особенность Mindbox — мультитенантная платформа: модели работают на данных разных клиентов с разными distributions.
Стек: Python + Catboost для табличных задач + PyTorch для нейросетей + K8s для deployment + ClickHouse как аналитический движок + MLflow для трекинга экспериментов.
Актуальные вакансии — на hh.ru и сайте Mindbox.
Информация основана на публичных источниках и опыте кандидатов. Команды Mindbox используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл занимает 3-4 недели и включает 5-6 этапов. Mindbox — продвинутая B2B SaaS-компания с сильной ML-культурой. Упор на marketing ML и uplift modeling.
1. HR-скрининг (30-45 минут)
Рекрутер проверяет фон: production-опыт ML, CDP / CRM / маркетинг ML background — плюс. Готовь питч 90 секунд. Если работал в marketing-tech, CRM, recsys в ритейле — упомяни сразу.
2. ML-теория (60-90 минут)
Базовая секция. Темы: градиентный бустинг (CatBoost), churn / propensity-модели, uplift modeling (S-learner, T-learner, X-learner, causal forests), recommendation. Будь готов про A/B-тестирование, causal inference.
Подготовка: ML-теория.
3. Python live coding (60 минут)
Live-кодинг: 1-2 задачи на алгоритмы (LeetCode Medium), плюс задача на ML-pipeline — реализовать Qini-кривую для uplift, sampling negative samples в recsys. Готовиться по LeetCode минимум 3-4 недели.
Подготовка: Python для DS.
4. ML System Design (90 минут)
Кейсовая секция. Кейсы: «churn prediction pipeline для B2B-клиентов», «recommendation товаров с учётом sequential behavior», «NBO uplift modeling с holdout». Нужно: уточнить бизнес-метрику (revenue lift, не accuracy), описать архитектуру для multi-tenant.
Подготовка: MLOps, Model serving, Feature stores.
5. Production / scale (60 минут)
Секция про инфраструктуру: K8s deployment, мониторинг, обработка multi-tenant нагрузки. Кейсы про откат, drift, инциденты с одним клиентом, не задевающие других.
Подготовка: Monitoring drift, Deployment strategies.
6. Поведенческое (45 минут)
С тимлидом. STAR-формат. Mindbox ценит ownership, инициативу, понимание marketing-домена.
Особенности по командам
Segmentation ML. Автоматическая сегментация клиентов на основе поведения, RFM-расширения, ML-сегменты. Командой делает custom-сегментацию для крупных клиентов и universal-сегментацию из коробки.
Churn / Retention ML. Churn prediction с горизонтом 30/60/90 дней, propensity для re-engagement. ML-driven CRM.
Recommendation. Recsys товаров (для e-commerce клиентов), контента (для медиа), sequential модели. Подойдёт MLE с recsys-опытом.
NBO / Uplift. Самая интересная для Mindbox команда: Next Best Offer с uplift modeling — какой оффер действительно увеличит конверсию у конкретного клиента (не просто скрининг high-propensity, а true causal effect). Подойдёт MLE с causal inference background.
Anti-spam. Защита коммуникаций от спама, контроль качества рассылок. ML-classification.
Что Mindbox ценит в MLE
Production ML. Базовое требование. Слабый — «делал на Kaggle»; сильный — «uplift-модель для retention-кампании, +12% revenue lift в treated cohort, deploy через K8s».
CDP / CRM context. Понимание customer-data платформ: heterogeneity, multi-tenancy, privacy. Если в marketing-tech не работал — изучи блоги Segment, Adobe.
Uplift / propensity. Слабый — «делал propensity»; сильный — «использовал S/T/X-learners, оценивал Qini-coefficient, проектировал holdout для measurement».
K8s. Без K8s сложно.
Catboost / PyTorch / Python. Стандарт.
Как готовиться: план
За 6-8 недель до собеседования:
- Неделя 1-2 — Python + ML + uplift. LeetCode Medium 30+ задач, uplift modeling, causal inference. Параллельно прорешай вопросы по Python, ML и SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. Python для DS, ML-теория.
- Неделя 3 — K8s + Docker. Подними хотя бы 1 модель в K8s.
- Неделя 4 — MLOps + feature stores. MLOps, Feature stores.
- Неделя 5 — System design + CRM ML. Кейсы churn, recommendation, uplift. Model serving.
- Неделя 6 — Monitoring + deployment. Monitoring drift.
- Неделя 7-8 — Mocks + behavioral. Mock-интервью, 5-7 STAR-историй.
Частые ошибки
Без CDP / CRM domain. Кандидат говорит «у меня e-commerce» — может пройти, но без понимания multi-tenant специфики отвалится. Сильный — «понимаю customer-data платформы, mulit-tenant constraints».
Без uplift modeling. Кандидат говорит «делал propensity» — для NBO-команды слабо. Сильный — «использовал meta-learners, проектировал holdout, измерял Qini-coefficient».
Без K8s. «Деплоил через docker-compose» — слабо. Сильный — «деплоил через K8s».
Только notebook. Кандидаты с Jupyter-only валятся. Сильный — «свои проекты переписал в виде пакетов».
Без production опыта. «У нас была модель» — не история. Сильный — «uplift-модель для retention, +12% revenue lift, мониторил эффект через causal A/B».
Связанные темы
- Собеседование на ML Engineer
- MLOps
- Feature stores
- Model serving
- Monitoring и drift
- Deployment strategies
FAQ
Удалёнка в Mindbox для MLE?
Часто полная удалёнка.
Зарплатные вилки 2026?
Middle MLE: 300-450k. Senior: 450-670k.
Английский нужен?
Базовый — желательно.
Сколько этапов?
5-6 этапов, 3-4 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.