Собеседование на ML Engineer
Что спрашивают на собесе ML Engineer
Собеседование на ML Engineer (MLE) проверяет: понимание production ML (deployment, serving, monitoring), MLOps (CI/CD моделей, feature stores), инфраструктура (Kubernetes, GPU, Spark), базовая ML-теория (бустинги, нейронки), системный дизайн ML-сервисов.
MLE отличается от DS: меньше про модель и feature engineering, больше про инфра, deployment, scaling. От DE: больше про модели и serving, меньше про DWH и ETL.
Этапы собеседования
1. Скрининг с рекрутером (20-30 минут). Опыт, стек, ожидания.
2. ML теория (60 минут). Базовая ML: bias-variance, бустинги, метрики. Не на уровне DS, но без — слабая позиция.
3. Python live coding (60 минут). Алгоритмы medium, иногда ML-задача (тренировка модели).
4. ML system design (60-90 минут). «Спроектируй serving для recommendation системы», «как обеспечишь low-latency inference».
5. Production / infra (60 минут). Kubernetes, GPU, CI/CD моделей, мониторинг drift.
6. Поведенческое (45 минут). STAR.
Главные темы по разделам
Production ML / Deployment
- Model serving (TorchServe, TensorFlow Serving, BentoML, FastAPI)
- Batch vs online inference
- Latency optimization (quantization, distillation)
- A/B-тесты ML моделей
- Canary / shadow deployments
MLOps
- ML pipelines (Kubeflow, Metaflow, Prefect, Airflow)
- Experiment tracking (MLflow, W&B, ClearML)
- Feature stores (Feast, Hopsworks, Tecton)
- Model registry
- CI/CD для моделей
Инфраструктура
- Kubernetes для ML
- GPU / TPU
- Distributed training (Horovod, PyTorch DDP)
- Model parallelism vs data parallelism
- Spark / Ray для distributed ML
Monitoring
- Model performance metrics
- Data drift (PSI, KS-тест)
- Concept drift
- Prediction quality monitoring
- Alerts на anomalies
ML теория (базовая)
Что MLE умеет хорошо делать
- Поднимать модель в production: контейнеры, scaling, latency
- Настраивать CI/CD pipeline для моделей
- Мониторить data / model drift
- Оптимизировать inference (cost vs latency)
- Управлять feature store
- A/B-тестировать модели в проде
Как готовиться: план
За 6-8 недель:
- Неделя 1-2 — Python + базовая ML. Python для DS.
- Неделя 3 — Kubernetes + Docker. Поднять модель в k8s.
- Неделя 4 — MLOps tools. MLflow, Kubeflow, feature stores.
- Неделя 5 — ML system design. Кейсы по deployment.
- Неделя 6 — Monitoring + drift.
- Неделя 7-8 — Mocks + behavioral.
Частые ошибки
- «Я DS — MLE подучу». Production-ML — отдельная дисциплина. Не выучивается за неделю.
- Без Kubernetes / Docker. В 2026 — must.
- Без feature store понимания. Спросят, как избежать train/serve skew.
- Без monitoring drift. Модель в проде «протухает» — нужны alerts.
- Игнор cost optimization. GPU дорогие, MLE должен thinking про cost.
FAQ
MLE или DS — что выбрать?
DS — больше про модели и эксперименты. MLE — больше про production и инфра. MLE обычно зарабатывает больше из-за инжен.специализации.
Сколько зарабатывает MLE 2026?
Middle: 280-450k. Senior: 450-700k. Принципал: 700k+.
Нужен ли deep learning?
Базовое понимание — да. Не обязательно реализовать модель, но objection «как развернуть BERT» — нормальный.
Где практиковать?
Поднять простую модель в Docker + k8s, добавить MLflow, A/B-тесты на synthetic data.
Какие компании в РФ нанимают MLE?
Яндекс, Сбер, Тинькофф, VK, Авито, Wildberries. Везде, где есть serious ML в проде.