Собеседование на ML Engineer в Okko

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Okko — особенный работодатель для MLE

Okko — один из ведущих VOD-сервисов в РФ, известный широким каталогом фильмов и сериалов, киноклассикой, спортивными трансляциями. Принадлежит «Рамблеру», входит в группу «Газпром-Медиа». Десятки миллионов пользователей, серьёзная библиотека лицензированного и оригинального контента. В отличие от других streaming-сервисов, Okko сильно фокусируется на спортивных правах и эксклюзивных голливудских новинках. Для ML-инженера это работа в крупном медийном бизнесе с разнообразным контентом.

ML-системы: recommendation контента (главная, «похожее», поиск, спортивная персонализация), NLP для метаданных (генерация описаний, классификация по жанрам), video AI (автоматические теги, метки сцен), retention prediction (predicted churn), антифрод (детекция шеринга аккаунтов), advertising-аналитика (для AVOD-трафика).

Стек: Python + Catboost для табличных задач + PyTorch для нейросетей (CV, NLP) + K8s для deployment + Hadoop для тяжёлых ETL + Greenplum как DWH + MLflow для трекинга экспериментов.

Актуальные вакансии — на hh.ru и сайте Okko.

Информация основана на публичных источниках и опыте кандидатов. Команды Okko используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

Цикл занимает 3-4 недели и включает 5-6 этапов. Okko — крупный медийный продукт. Упор на recsys, video AI, production-навыки.

1. HR-скрининг (30-45 минут)

Рекрутер проверяет фон: production-опыт ML, media / streaming background. Готовь питч 90 секунд. Если работал в media, streaming, recsys в e-commerce — упомяни сразу.

2. ML-теория (60-90 минут)

Базовая секция. Темы: градиентный бустинг, recommendation (CF, two-tower, ranking), CV / NLP, специфика recsys в media (watch time vs CTR, freshness, diversity). Подготовка: ML-теория.

3. Python live coding (60 минут)

Live-кодинг: алгоритмы (LeetCode Medium), ML pipeline. Готовиться по LeetCode минимум 3-4 недели.

Подготовка: Python для DS.

4. ML System Design (90 минут)

Кейсы: «recommendation pipeline для главной», «video metadata AI», «retention prediction». Уточнить бизнес-метрику, описать архитектуру (retrieval → ranking → re-ranking), выбрать модели, продумать cold start.

Подготовка: MLOps, Model serving, Feature stores.

5. Production / scale (60 минут)

K8s deployment, мониторинг, обработка миллионов рекомендательных запросов. Кейсы про откат, drift.

Подготовка: Monitoring drift, Deployment strategies.

6. Поведенческое (45 минут)

С тимлидом. STAR-формат. Okko ценит ownership и понимание медиа-домена.

Особенности по командам

Recommendation. Ядро продукта: главная, «похожее», поиск. Команда самая большая, two-tower retrieval + Catboost / нейросети ranking. Подойдёт MLE с recsys-опытом.

Video AI. Обработка видео: теги, сцены, обложки, ASR. Стек включает PyTorch, CLIP-like. R&D-направление.

NLP. Описания фильмов, классификация жанров, sentiment отзывов.

Retention ML. Прогноз churn, propensity re-engagement, ML-driven CRM.

Антифрод. Детекция шеринга аккаунтов, накруток просмотров.

Что Okko ценит в MLE

Production ML. Базовое требование.

Media / streaming context. Понимание recsys-метрик в медиа: watch time vs CTR, freshness.

CV / NLP fluency. Transformer-архитектуры, fine-tuning.

K8s. Без K8s сложно.

Catboost / PyTorch / Python. Стандарт.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 6-8 недель до собеседования:

  1. Неделя 1-2 — Python + ML + recommendation. LeetCode Medium 30+ задач, recsys (CF, two-tower), бустинги. Параллельно прорешай вопросы по Python, ML и SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. Python для DS, ML-теория.
  2. Неделя 3 — K8s + Docker. Подними хотя бы 1 модель в K8s.
  3. Неделя 4 — MLOps + feature stores. MLOps, Feature stores.
  4. Неделя 5 — System design + video AI. Кейсы recommendation, video tagging, retention. Model serving.
  5. Неделя 6 — Monitoring + deployment. Monitoring drift.
  6. Неделя 7-8 — Mocks + behavioral. Mock-интервью, 5-7 STAR-историй.

Частые ошибки

Без media domain. На System Design заметно. Сильный — «понимаю watch time optimization, content-driven retention».

Без recommendation. Кандидат говорит «делал бустинги» — без recsys-specifics слабо. Сильный — «работал с two-tower retrieval, cold start».

Без K8s. «Деплоил через docker-compose» — слабо.

Только notebook. Кандидаты с Jupyter-only валятся.

Без CV / NLP. Без minimum знаний — отвалишься. Сильный — «знаю transformer-архитектуры, fine-tuning».

Связанные темы

FAQ

Удалёнка в Okko для MLE?

Часто полная удалёнка.

Зарплатные вилки 2026?

Middle MLE: 270-430k. Senior: 430-650k.

Английский нужен?

Базовый — желательно.

Сколько этапов?

5-6 этапов, 3-4 недели.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.