Собеседование на ML Engineer в Иви
Содержание:
Почему Иви — особенный работодатель для MLE
Иви — один из крупнейших VOD-сервисов в РФ, известный широким каталогом фильмов и сериалов, оригинальным контентом и сильной recommendation-системой. Десятки миллионов активных пользователей в месяц, библиотека из десятков тысяч единиц контента, миксованная модель монетизации (подписка + AVOD). В отличие от подписочных-only сервисов (Кинопоиск Плюс), Иви балансирует подписочную и рекламную модели, что добавляет сложности в ML-аналитику.
ML-системы: recommendation контента (главная, «похожее», поиск, персонализация подборок), NLP для метаданных (генерация описаний, классификация по жанрам, sentiment-анализ отзывов), video AI (автоматические теги, метки сцен, encoding-аналитика), retention prediction (predicted churn, propensity для re-engagement), антифрод (детекция шеринга аккаунтов, накруток просмотров).
Стек: Python + Catboost для табличных задач + PyTorch для нейросетей (CV для video AI, NLP для текстов) + K8s для deployment + Hadoop для тяжёлых ETL + Greenplum как DWH + MLflow для трекинга экспериментов.
Актуальные вакансии — на hh.ru и сайте Иви.
Информация основана на публичных источниках и опыте кандидатов. Команды Иви используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл занимает 3-4 недели и включает 5-6 этапов. Иви — крупный медийный продукт со сильной ML-культурой. Упор на recsys, video AI и production-навыки.
1. HR-скрининг (30-45 минут)
Рекрутер проверяет фон: production-опыт ML, media / streaming / recsys background. Готовь питч на 90 секунд: проекты, бизнес-эффект, стек. Если работал в media, streaming, recsys в e-commerce — упомяни сразу.
2. ML-теория (60-90 минут)
Базовая секция. Темы: градиентный бустинг, recommendation (CF, two-tower, factorization, ranking), CV (CNN, transformers для video), NLP (BERT, fine-tuning). Будь готов рассказать про recsys-метрики в media (watch time vs CTR, freshness, diversity).
Подготовка: ML-теория.
3. Python live coding (60 минут)
Live-кодинг: 1-2 задачи на алгоритмы (LeetCode Medium), плюс задача на ML-pipeline — реализовать NDCG, sampling negative samples для recsys, отладить чужой код. Готовиться по LeetCode минимум 3-4 недели.
Подготовка: Python для DS.
4. ML System Design (90 минут)
Кейсовая секция. Кейсы: «спроектируй recommendation pipeline для главной Иви», «video metadata AI (теги, сцены)», «retention prediction для retention-кампаний». Нужно: уточнить бизнес-метрику, описать архитектуру (retrieval → ranking → re-ranking), выбрать модели, продумать cold start.
Подготовка: MLOps, Model serving, Feature stores.
5. Production / scale (60 минут)
Секция про инфраструктуру: K8s deployment, мониторинг, обработка миллионов рекомендательных запросов в день. Кейсы про откат, drift, инциденты.
Подготовка: Monitoring drift, Deployment strategies.
6. Поведенческое (45 минут)
С тимлидом. STAR-формат: конфликт с продактом, факап с моделью, спор по архитектуре. Иви ценит ownership и понимание медиа-домена.
Особенности по командам
Recommendation. Ядро продукта: главная, «похожее», поиск. Команда самая большая, работает с two-tower retrieval + Catboost / нейросети для ranking. Главные челленджи: cold start для нового контента, баланс freshness vs popularity, explore/exploit. Подойдёт MLE с recsys-опытом в media / e-commerce.
Video AI. Обработка видео: автоматические теги, поиск ключевых сцен, генерация обложек, ASR. Стек включает PyTorch, CLIP-like, video transformers. R&D-направление. Подойдёт MLE с CV-background.
NLP. Описания фильмов, классификация по жанрам, sentiment на отзывах, генерация saммаризаций. Подойдёт MLE с NLP-опытом.
Retention ML. Прогноз оттока, propensity для re-engagement, ML-driven CRM. Тесная работа с маркетингом. Подойдёт кандидатам с retention-опытом в подписке.
Антифрод. Детекция шеринга аккаунтов, накруток просмотров, abuse. ML-системы анализируют поведенческие паттерны. Подойдёт тем, у кого опыт в anti-fraud.
Что Иви ценит в MLE
Production ML. Базовое требование. Слабый — «делал на Kaggle»; сильный — «recommendation на 5М DAU, +1.5% retention D7, поборол degradation за 2 недели».
Media / streaming context. Понимание особенностей recsys в медиа: watch time vs CTR, freshness, content-driven retention. Если в media не работал, читай Netflix Tech, Spotify Engineering.
CV / NLP fluency. Не обязательно эксперт в обоих, но базовый язык — твой. Transformer-архитектуры, attention, fine-tuning.
K8s. Без K8s сложно.
Catboost / PyTorch / Python. Стандарт.
Как готовиться: план
За 6-8 недель до собеседования:
- Неделя 1-2 — Python + ML + recommendation. LeetCode Medium 30+ задач, recsys (CF, two-tower), бустинги. Параллельно прорешай вопросы по Python, ML и SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. Python для DS, ML-теория.
- Неделя 3 — K8s + Docker. Подними хотя бы 1 модель в K8s.
- Неделя 4 — MLOps + feature stores. MLOps, Feature stores.
- Неделя 5 — System design + video AI. Кейсы recommendation, video tagging, retention. Model serving.
- Неделя 6 — Monitoring + deployment. Drift, A/B. Monitoring drift.
- Неделя 7-8 — Mocks + behavioral. Mock-интервью, 5-7 STAR-историй.
Частые ошибки
Без media domain. На System Design заметно. Сильный — «изучил media recsys, понимаю watch time optimization, content-driven retention».
Без recommendation understanding. Кандидат говорит «делал бустинги» — без recsys-specifics слабо. Сильный — «работал с two-tower retrieval, проблемой cold start, popularity bias».
Без K8s. «Деплоил через docker-compose» — слабо. Сильный — «деплоил через K8s, использовал canary».
Только notebook. Кандидаты с Jupyter-only валятся. Сильный — «свои проекты переписал в виде пакетов».
Без CV / NLP. Без minimum знаний в transformers/attention — на System Design отвалишься. Сильный — «знаю transformer-архитектуры, fine-tuning, использовал CLIP-подобные модели».
Связанные темы
- Собеседование на ML Engineer
- MLOps
- Feature stores
- Model serving
- Monitoring и drift
- Deployment strategies
FAQ
Удалёнка в Иви для MLE?
Часто полная удалёнка, особенно для senior+.
Зарплатные вилки 2026?
Middle MLE: 280-440k. Senior: 440-660k.
Английский нужен?
Базовый — желательно (статьи, инструменты). Свободный — не обязателен.
Сколько этапов?
5-6 этапов, 3-4 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.