Собеседование на ML Engineer

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Что спрашивают на собесе ML Engineer

Собеседование на ML Engineer (MLE) проверяет: понимание production ML (deployment, serving, monitoring), MLOps (CI/CD моделей, feature stores), инфраструктура (Kubernetes, GPU, Spark), базовая ML-теория (бустинги, нейронки), системный дизайн ML-сервисов.

MLE отличается от DS: меньше про модель и feature engineering, больше про инфра, deployment, scaling. От DE: больше про модели и serving, меньше про DWH и ETL.

Этапы собеседования

1. Скрининг с рекрутером (20-30 минут). Опыт, стек, ожидания.

2. ML теория (60 минут). Базовая ML: bias-variance, бустинги, метрики. Не на уровне DS, но без — слабая позиция.

3. Python live coding (60 минут). Алгоритмы medium, иногда ML-задача (тренировка модели).

4. ML system design (60-90 минут). «Спроектируй serving для recommendation системы», «как обеспечишь low-latency inference».

5. Production / infra (60 минут). Kubernetes, GPU, CI/CD моделей, мониторинг drift.

6. Поведенческое (45 минут). STAR.

Главные темы по разделам

Production ML / Deployment

  • Model serving (TorchServe, TensorFlow Serving, BentoML, FastAPI)
  • Batch vs online inference
  • Latency optimization (quantization, distillation)
  • A/B-тесты ML моделей
  • Canary / shadow deployments

MLOps

  • ML pipelines (Kubeflow, Metaflow, Prefect, Airflow)
  • Experiment tracking (MLflow, W&B, ClearML)
  • Feature stores (Feast, Hopsworks, Tecton)
  • Model registry
  • CI/CD для моделей

Инфраструктура

  • Kubernetes для ML
  • GPU / TPU
  • Distributed training (Horovod, PyTorch DDP)
  • Model parallelism vs data parallelism
  • Spark / Ray для distributed ML

Monitoring

  • Model performance metrics
  • Data drift (PSI, KS-тест)
  • Concept drift
  • Prediction quality monitoring
  • Alerts на anomalies

ML теория (базовая)

Что MLE умеет хорошо делать

  • Поднимать модель в production: контейнеры, scaling, latency
  • Настраивать CI/CD pipeline для моделей
  • Мониторить data / model drift
  • Оптимизировать inference (cost vs latency)
  • Управлять feature store
  • A/B-тестировать модели в проде

Как готовиться: план

За 6-8 недель:

  1. Неделя 1-2 — Python + базовая ML. Python для DS.
  2. Неделя 3 — Kubernetes + Docker. Поднять модель в k8s.
  3. Неделя 4 — MLOps tools. MLflow, Kubeflow, feature stores.
  4. Неделя 5 — ML system design. Кейсы по deployment.
  5. Неделя 6 — Monitoring + drift.
  6. Неделя 7-8 — Mocks + behavioral.

Частые ошибки

  • «Я DS — MLE подучу». Production-ML — отдельная дисциплина. Не выучивается за неделю.
  • Без Kubernetes / Docker. В 2026 — must.
  • Без feature store понимания. Спросят, как избежать train/serve skew.
  • Без monitoring drift. Модель в проде «протухает» — нужны alerts.
  • Игнор cost optimization. GPU дорогие, MLE должен thinking про cost.

FAQ

MLE или DS — что выбрать?

DS — больше про модели и эксперименты. MLE — больше про production и инфра. MLE обычно зарабатывает больше из-за инжен.специализации.

Сколько зарабатывает MLE 2026?

Middle: 280-450k. Senior: 450-700k. Принципал: 700k+.

Нужен ли deep learning?

Базовое понимание — да. Не обязательно реализовать модель, но objection «как развернуть BERT» — нормальный.

Где практиковать?

Поднять простую модель в Docker + k8s, добавить MLflow, A/B-тесты на synthetic data.

Какие компании в РФ нанимают MLE?

Яндекс, Сбер, Тинькофф, VK, Авито, Wildberries. Везде, где есть serious ML в проде.