Собеседование на ML Engineer в Rutube
Содержание:
Почему Rutube — особенный работодатель для MLE
Rutube — крупная UGC-видеоплатформа «Газпром-Медиа», российский ответ YouTube. После ограничений западных платформ Rutube активно растёт как основная площадка для русскоязычных авторов и зрителей. Десятки миллионов активных пользователей в месяц, миллиарды просмотров, активная creator-программа с монетизацией. Для ML-инженера это уникальная возможность работать с большими UGC-данными на масштабе.
ML-системы: recommendation UGC-контента (главная, «похожее», поиск), NLP для метаданных (классификация тематики, описаний, sentiment комментариев), video AI (модерация контента, автоматические теги, детекция запрещённого контента), антифрод (детекция накруток просмотров, спама, ботов), advertising-аналитика для AVOD-трафика.
Стек: Python + Catboost для табличных задач + PyTorch для нейросетей (CV для video, NLP) + K8s для deployment + Hadoop для тяжёлых ETL + Greenplum как DWH + MLflow для трекинга экспериментов.
Актуальные вакансии — на hh.ru и сайте Rutube.
Информация основана на публичных источниках и опыте кандидатов. Команды Rutube используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл занимает 3-4 недели и включает 5-6 этапов. Rutube — крупный медийный продукт. Упор на recsys, video AI и масштаб.
1. HR-скрининг (30-45 минут)
Рекрутер проверяет фон: production-опыт ML, UGC / video / media background. Готовь питч 90 секунд.
2. ML-теория (60-90 минут)
Базовая секция. Темы: градиентный бустинг, recommendation (CF, two-tower), CV / NLP. Подготовка: ML-теория.
3. Python live coding (60 минут)
Live-кодинг: алгоритмы, ML pipeline. Готовиться по LeetCode минимум 3-4 недели.
Подготовка: Python для DS.
4. ML System Design (90 минут)
Кейсы: «UGC recommendation pipeline», «content moderation», «video metadata AI». Описать архитектуру.
Подготовка: MLOps, Model serving, Feature stores.
5. Production / scale (60 минут)
K8s deployment, мониторинг. Обработка миллиардов событий в день.
Подготовка: Monitoring drift, Deployment strategies.
6. Поведенческое (45 минут)
С тимлидом. STAR-формат. Rutube ценит ownership и интерес к UGC.
Особенности по командам
Recommendation. Ядро продукта: главная, «похожее», поиск. Two-tower retrieval + Catboost. Главные челленджи: cold start для нового UGC, эксплойт/explore, диверсификация.
Video AI. Модерация контента, автоматические теги, детекция запрещённого. CV / NLP-модели.
NLP. Комментарии, описания, sentiment.
Antifraud. Боты, спам, накрутки. Behavior-анализ.
Search. Поиск видео: классическое learning-to-rank на UGC.
Что Rutube ценит в MLE
Production ML на масштабе. Базовое требование.
UGC / video context. Понимание creator economy и UGC-динамики.
CV / NLP fluency. Transformer-архитектуры.
K8s. Без K8s сложно.
Catboost / PyTorch / Python. Стандарт.
Как готовиться: план
За 6-8 недель до собеседования:
- Неделя 1-2 — Python + ML + recommendation. LeetCode Medium 30+ задач, recsys, бустинги. Параллельно прорешай вопросы по Python, ML и SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. Python для DS, ML-теория.
- Неделя 3 — K8s + Docker. Подними хотя бы 1 модель в K8s.
- Неделя 4 — MLOps + feature stores. MLOps, Feature stores.
- Неделя 5 — System design + video AI. Кейсы recommendation, moderation, video tagging. Model serving.
- Неделя 6 — Monitoring + deployment. Monitoring drift.
- Неделя 7-8 — Mocks + behavioral. Mock-интервью, 5-7 STAR-историй.
Частые ошибки
Без UGC / video domain. Сильный — «понимаю creator economy, UGC-динамику».
Без recommendation. Без recsys-specifics слабо.
Без K8s. «Деплоил через docker-compose» — слабо.
Только notebook. Кандидаты с Jupyter-only валятся.
Без CV / NLP. Без minimum знаний — отвалишься.
Связанные темы
- Собеседование на ML Engineer
- MLOps
- Feature stores
- Model serving
- Monitoring и drift
- Deployment strategies
FAQ
Удалёнка в Rutube для MLE?
Гибрид и удалёнка распространены.
Зарплатные вилки 2026?
Middle MLE: 270-410k. Senior: 410-620k.
Английский нужен?
Базовый — желательно.
Сколько этапов?
5-6 этапов, 3-4 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.