Собеседование на ML Engineer в Okko
Содержание:
Почему Okko — особенный работодатель для MLE
Okko — один из ведущих VOD-сервисов в РФ, известный широким каталогом фильмов и сериалов, киноклассикой, спортивными трансляциями. Принадлежит «Рамблеру», входит в группу «Газпром-Медиа». Десятки миллионов пользователей, серьёзная библиотека лицензированного и оригинального контента. В отличие от других streaming-сервисов, Okko сильно фокусируется на спортивных правах и эксклюзивных голливудских новинках. Для ML-инженера это работа в крупном медийном бизнесе с разнообразным контентом.
ML-системы: recommendation контента (главная, «похожее», поиск, спортивная персонализация), NLP для метаданных (генерация описаний, классификация по жанрам), video AI (автоматические теги, метки сцен), retention prediction (predicted churn), антифрод (детекция шеринга аккаунтов), advertising-аналитика (для AVOD-трафика).
Стек: Python + Catboost для табличных задач + PyTorch для нейросетей (CV, NLP) + K8s для deployment + Hadoop для тяжёлых ETL + Greenplum как DWH + MLflow для трекинга экспериментов.
Актуальные вакансии — на hh.ru и сайте Okko.
Информация основана на публичных источниках и опыте кандидатов. Команды Okko используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл занимает 3-4 недели и включает 5-6 этапов. Okko — крупный медийный продукт. Упор на recsys, video AI, production-навыки.
1. HR-скрининг (30-45 минут)
Рекрутер проверяет фон: production-опыт ML, media / streaming background. Готовь питч 90 секунд. Если работал в media, streaming, recsys в e-commerce — упомяни сразу.
2. ML-теория (60-90 минут)
Базовая секция. Темы: градиентный бустинг, recommendation (CF, two-tower, ranking), CV / NLP, специфика recsys в media (watch time vs CTR, freshness, diversity). Подготовка: ML-теория.
3. Python live coding (60 минут)
Live-кодинг: алгоритмы (LeetCode Medium), ML pipeline. Готовиться по LeetCode минимум 3-4 недели.
Подготовка: Python для DS.
4. ML System Design (90 минут)
Кейсы: «recommendation pipeline для главной», «video metadata AI», «retention prediction». Уточнить бизнес-метрику, описать архитектуру (retrieval → ranking → re-ranking), выбрать модели, продумать cold start.
Подготовка: MLOps, Model serving, Feature stores.
5. Production / scale (60 минут)
K8s deployment, мониторинг, обработка миллионов рекомендательных запросов. Кейсы про откат, drift.
Подготовка: Monitoring drift, Deployment strategies.
6. Поведенческое (45 минут)
С тимлидом. STAR-формат. Okko ценит ownership и понимание медиа-домена.
Особенности по командам
Recommendation. Ядро продукта: главная, «похожее», поиск. Команда самая большая, two-tower retrieval + Catboost / нейросети ranking. Подойдёт MLE с recsys-опытом.
Video AI. Обработка видео: теги, сцены, обложки, ASR. Стек включает PyTorch, CLIP-like. R&D-направление.
NLP. Описания фильмов, классификация жанров, sentiment отзывов.
Retention ML. Прогноз churn, propensity re-engagement, ML-driven CRM.
Антифрод. Детекция шеринга аккаунтов, накруток просмотров.
Что Okko ценит в MLE
Production ML. Базовое требование.
Media / streaming context. Понимание recsys-метрик в медиа: watch time vs CTR, freshness.
CV / NLP fluency. Transformer-архитектуры, fine-tuning.
K8s. Без K8s сложно.
Catboost / PyTorch / Python. Стандарт.
Как готовиться: план
За 6-8 недель до собеседования:
- Неделя 1-2 — Python + ML + recommendation. LeetCode Medium 30+ задач, recsys (CF, two-tower), бустинги. Параллельно прорешай вопросы по Python, ML и SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. Python для DS, ML-теория.
- Неделя 3 — K8s + Docker. Подними хотя бы 1 модель в K8s.
- Неделя 4 — MLOps + feature stores. MLOps, Feature stores.
- Неделя 5 — System design + video AI. Кейсы recommendation, video tagging, retention. Model serving.
- Неделя 6 — Monitoring + deployment. Monitoring drift.
- Неделя 7-8 — Mocks + behavioral. Mock-интервью, 5-7 STAR-историй.
Частые ошибки
Без media domain. На System Design заметно. Сильный — «понимаю watch time optimization, content-driven retention».
Без recommendation. Кандидат говорит «делал бустинги» — без recsys-specifics слабо. Сильный — «работал с two-tower retrieval, cold start».
Без K8s. «Деплоил через docker-compose» — слабо.
Только notebook. Кандидаты с Jupyter-only валятся.
Без CV / NLP. Без minimum знаний — отвалишься. Сильный — «знаю transformer-архитектуры, fine-tuning».
Связанные темы
- Собеседование на ML Engineer
- MLOps
- Feature stores
- Model serving
- Monitoring и drift
- Deployment strategies
FAQ
Удалёнка в Okko для MLE?
Часто полная удалёнка.
Зарплатные вилки 2026?
Middle MLE: 270-430k. Senior: 430-650k.
Английский нужен?
Базовый — желательно.
Сколько этапов?
5-6 этапов, 3-4 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.