Собеседование на ML Engineer в Иви

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Иви — особенный работодатель для MLE

Иви — один из крупнейших VOD-сервисов в РФ, известный широким каталогом фильмов и сериалов, оригинальным контентом и сильной recommendation-системой. Десятки миллионов активных пользователей в месяц, библиотека из десятков тысяч единиц контента, миксованная модель монетизации (подписка + AVOD). В отличие от подписочных-only сервисов (Кинопоиск Плюс), Иви балансирует подписочную и рекламную модели, что добавляет сложности в ML-аналитику.

ML-системы: recommendation контента (главная, «похожее», поиск, персонализация подборок), NLP для метаданных (генерация описаний, классификация по жанрам, sentiment-анализ отзывов), video AI (автоматические теги, метки сцен, encoding-аналитика), retention prediction (predicted churn, propensity для re-engagement), антифрод (детекция шеринга аккаунтов, накруток просмотров).

Стек: Python + Catboost для табличных задач + PyTorch для нейросетей (CV для video AI, NLP для текстов) + K8s для deployment + Hadoop для тяжёлых ETL + Greenplum как DWH + MLflow для трекинга экспериментов.

Актуальные вакансии — на hh.ru и сайте Иви.

Информация основана на публичных источниках и опыте кандидатов. Команды Иви используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

Цикл занимает 3-4 недели и включает 5-6 этапов. Иви — крупный медийный продукт со сильной ML-культурой. Упор на recsys, video AI и production-навыки.

1. HR-скрининг (30-45 минут)

Рекрутер проверяет фон: production-опыт ML, media / streaming / recsys background. Готовь питч на 90 секунд: проекты, бизнес-эффект, стек. Если работал в media, streaming, recsys в e-commerce — упомяни сразу.

2. ML-теория (60-90 минут)

Базовая секция. Темы: градиентный бустинг, recommendation (CF, two-tower, factorization, ranking), CV (CNN, transformers для video), NLP (BERT, fine-tuning). Будь готов рассказать про recsys-метрики в media (watch time vs CTR, freshness, diversity).

Подготовка: ML-теория.

3. Python live coding (60 минут)

Live-кодинг: 1-2 задачи на алгоритмы (LeetCode Medium), плюс задача на ML-pipeline — реализовать NDCG, sampling negative samples для recsys, отладить чужой код. Готовиться по LeetCode минимум 3-4 недели.

Подготовка: Python для DS.

4. ML System Design (90 минут)

Кейсовая секция. Кейсы: «спроектируй recommendation pipeline для главной Иви», «video metadata AI (теги, сцены)», «retention prediction для retention-кампаний». Нужно: уточнить бизнес-метрику, описать архитектуру (retrieval → ranking → re-ranking), выбрать модели, продумать cold start.

Подготовка: MLOps, Model serving, Feature stores.

5. Production / scale (60 минут)

Секция про инфраструктуру: K8s deployment, мониторинг, обработка миллионов рекомендательных запросов в день. Кейсы про откат, drift, инциденты.

Подготовка: Monitoring drift, Deployment strategies.

6. Поведенческое (45 минут)

С тимлидом. STAR-формат: конфликт с продактом, факап с моделью, спор по архитектуре. Иви ценит ownership и понимание медиа-домена.

Особенности по командам

Recommendation. Ядро продукта: главная, «похожее», поиск. Команда самая большая, работает с two-tower retrieval + Catboost / нейросети для ranking. Главные челленджи: cold start для нового контента, баланс freshness vs popularity, explore/exploit. Подойдёт MLE с recsys-опытом в media / e-commerce.

Video AI. Обработка видео: автоматические теги, поиск ключевых сцен, генерация обложек, ASR. Стек включает PyTorch, CLIP-like, video transformers. R&D-направление. Подойдёт MLE с CV-background.

NLP. Описания фильмов, классификация по жанрам, sentiment на отзывах, генерация saммаризаций. Подойдёт MLE с NLP-опытом.

Retention ML. Прогноз оттока, propensity для re-engagement, ML-driven CRM. Тесная работа с маркетингом. Подойдёт кандидатам с retention-опытом в подписке.

Антифрод. Детекция шеринга аккаунтов, накруток просмотров, abuse. ML-системы анализируют поведенческие паттерны. Подойдёт тем, у кого опыт в anti-fraud.

Что Иви ценит в MLE

Production ML. Базовое требование. Слабый — «делал на Kaggle»; сильный — «recommendation на 5М DAU, +1.5% retention D7, поборол degradation за 2 недели».

Media / streaming context. Понимание особенностей recsys в медиа: watch time vs CTR, freshness, content-driven retention. Если в media не работал, читай Netflix Tech, Spotify Engineering.

CV / NLP fluency. Не обязательно эксперт в обоих, но базовый язык — твой. Transformer-архитектуры, attention, fine-tuning.

K8s. Без K8s сложно.

Catboost / PyTorch / Python. Стандарт.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 6-8 недель до собеседования:

  1. Неделя 1-2 — Python + ML + recommendation. LeetCode Medium 30+ задач, recsys (CF, two-tower), бустинги. Параллельно прорешай вопросы по Python, ML и SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. Python для DS, ML-теория.
  2. Неделя 3 — K8s + Docker. Подними хотя бы 1 модель в K8s.
  3. Неделя 4 — MLOps + feature stores. MLOps, Feature stores.
  4. Неделя 5 — System design + video AI. Кейсы recommendation, video tagging, retention. Model serving.
  5. Неделя 6 — Monitoring + deployment. Drift, A/B. Monitoring drift.
  6. Неделя 7-8 — Mocks + behavioral. Mock-интервью, 5-7 STAR-историй.

Частые ошибки

Без media domain. На System Design заметно. Сильный — «изучил media recsys, понимаю watch time optimization, content-driven retention».

Без recommendation understanding. Кандидат говорит «делал бустинги» — без recsys-specifics слабо. Сильный — «работал с two-tower retrieval, проблемой cold start, popularity bias».

Без K8s. «Деплоил через docker-compose» — слабо. Сильный — «деплоил через K8s, использовал canary».

Только notebook. Кандидаты с Jupyter-only валятся. Сильный — «свои проекты переписал в виде пакетов».

Без CV / NLP. Без minimum знаний в transformers/attention — на System Design отвалишься. Сильный — «знаю transformer-архитектуры, fine-tuning, использовал CLIP-подобные модели».

Связанные темы

FAQ

Удалёнка в Иви для MLE?

Часто полная удалёнка, особенно для senior+.

Зарплатные вилки 2026?

Middle MLE: 280-440k. Senior: 440-660k.

Английский нужен?

Базовый — желательно (статьи, инструменты). Свободный — не обязателен.

Сколько этапов?

5-6 этапов, 3-4 недели.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.