Собеседование на ML Engineer в START
Содержание:
Почему START — особенный работодатель для MLE
START — российский VOD-сервис, известный собственным производством оригинальных сериалов и фильмов. На рынке российского streaming START конкурирует с Кинопоиском, Okko, Иви, Wink. Особенность — фокус на оригинальный контент (продюсерские проекты «Содержанки», «Псих», «Контейнер») и постоянные премьеры новых серий, которые драйвят retention. Для ML-инженера это работа в medium-sized streaming-сервисе с серьёзной recsys-инфраструктурой и оригинальным контент-каталогом.
ML-системы: recommendation контента (главная, «похожее», поиск), NLP для метаданных (классификация по жанрам, sentiment отзывов), video AI (автоматические теги к новым сериям, метки сцен), retention prediction (особенно вокруг релизов оригинального контента), антифрод (детекция шеринга аккаунтов), advertising для AVOD-аудитории.
Особенность START относительно более крупных конкурентов — это контент-first продукт: ML работает в плотной связке с релизным циклом, премьеры новых серий — главные events для recsys и retention-моделей. Команда меньше, чем в Кинопоиске или Okko, что значит больше «зон ответственности» на одного MLE — от подготовки данных до production deploy без отдельной MLOps-команды. Подойдёт инженерам, кто любит full-stack ML и не боится сам тянуть пайплайн от данных до сервиса.
Стек: Python + Catboost + PyTorch + K8s + Hadoop + Greenplum + MLflow.
Актуальные вакансии — на hh.ru и сайте START.
Информация основана на публичных источниках и опыте кандидатов. Команды START используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл занимает 3-4 недели и включает 5-6 этапов. START — компания среднего размера для streaming. Упор на recsys и video AI.
1. HR-скрининг (30-45 минут)
Рекрутер проверяет фон: production-опыт ML (1+ лет работы с моделями в проде), media / streaming background, причины ухода, ожидания. Если работал в Кинопоиске, Okko, Иви, Wink, KION — упомяни в первые 30 секунд, это сильно ускоряет процесс. Готовь питч на 90 секунд: что делал, какие модели в проде, какой эффект на метрику. Параллельно рекрутер спрашивает про знакомство с Catboost / PyTorch / K8s и формат работы.
2. ML-теория (60-90 минут)
Базовая секция с ведущим ML-инженером. Темы: градиентный бустинг (Catboost vs XGBoost, обработка категориальных, ordered boosting), recommendation (collaborative filtering, two-tower retrieval, ranking metrics NDCG/MAP), embeddings, базовые CV/NLP-архитектуры (CNN, Transformer, attention), классификация и регрессия в production. Будь готов рассказать про cold start — для оригинального контента START это острая проблема, так как новый сериал часто становится главным драйвером ARR.
Подготовка: ML-теория.
3. Python live coding (60 минут)
Live-кодинг: 2 задачи на алгоритмы и структуры данных (LeetCode Medium уровень — деревья, графы, динамика, two pointers), плюс одна задача на ML pipeline: написать функцию для расчёта NDCG@k, написать sampler для negative samples, отладить чужой код с утечкой train/test. Готовиться по LeetCode минимум 3-4 недели, 30-50 решённых Medium-задач даёт уверенность.
Подготовка: Python для DS.
4. ML System Design (90 минут)
Продуктовый кейс уровня «спроектируй ранжирование главной страницы START для возвращающегося пользователя» или «спроектируй автоматическое тегирование сцен в новой серии». Нужно: уточнить бизнес-метрику, описать архитектуру retrieval → ranking, выбрать модели и обоснование, продумать фичи (offline + online), описать train/eval данные, A/B-план, мониторинг. Сильные ответы — те, где видно понимание trade-off latency vs quality и опыт production-проблем (cold start, train-serving skew). Слабые — где кандидат сразу прыгает в «возьмём BERT» без обсуждения метрик и данных.
Подготовка: MLOps, Model serving, Feature stores.
5. Production / scale (60 минут)
Секция с senior-инженером про инфраструктуру: как поднимал модели в K8s (deployment, HPA, canary), как мониторил drift, как разруливал инциденты с упавшим качеством. Конкретные кейсы про latency optimization (квантизация, distillation), batch vs streaming inference, работа с большими ETL на Hadoop / Greenplum. Заготовь 2-3 истории про продакшен с цифрами — без них секция тяжёлая.
Подготовка: Monitoring drift, Deployment strategies.
6. Поведенческое (45 минут)
STAR-формат с тимлидом. Расскажи про конфликт с продактом (например, спор по метрике рекомендаций — CTR vs watch time), про факап с моделью в проде, про спор по архитектуре. Параллельно проверяют ownership и готовность тащить инициативы — в команде среднего размера это критично.
Особенности по командам
Recommendation. Ядро продукта: главная, «похожее», «продолжить смотреть», подборки. Архитектура — двухбашенная для retrieval + Catboost/нейросети для ранжирования. Главные челленджи: cold start для оригинальных премьер, баланс «свежее vs популярное», explore/exploit. Команда самая большая, в плотной связке с продактами. Подойдёт MLE с опытом recsys в e-commerce, музыке или других медиа-сервисах.
Video AI. Обработка видео-контента: автоматическая разметка тегами, поиск ключевых сцен, генерация постеров и thumbnails, ASR для русскоязычного контента. Стек: PyTorch, CLIP-like модели, video transformers. Команда меньше, больше R&D-направленности. Подойдёт инженеру с CV-background и опытом обработки видео-данных.
NLP. Обработка описаний фильмов, рецензий, поисковых запросов. Задачи: классификация по жанрам, sentiment, генерация коротких описаний, модерация. LLM-инфраструктура — частично open-source модели, частично внутренние fine-tuned. Часто пересекается с recommendation: использовать embeddings описаний для ранжирования.
Retention ML. Прогноз отписки, propensity-модели для апсейла и win-back, ML-driven CRM. Специфика START — связка с релизным графиком: модель должна учитывать, что юзер досмотрел оригинальный сериал и пик его engagement позади. Подойдёт MLE с background в banking/telco churn или другим subscription-сервисам.
Antifraud. Детекция шеринга аккаунтов и нетипичной активности. Классические anomaly-detection задачи плюс правила. Меньше про ML breakthrough, больше про надёжный production-stack с алертами. Подойдёт MLE, кто работал с anti-fraud в банках или маркетплейсах.
Что START ценит в MLE
Production ML. Самое важное. Слабый кандидат рассказывает про «модель в Jupyter, accuracy 0.92». Сильный — «запустил рекомендатор на 1.5М DAU, +1.8% retention D7 в A/B, продакшен на K8s с canary, мониторинг drift через дашборд». Готовь 2-3 такие истории.
Media / streaming context. Слабый кандидат не понимает разницу между CTR-оптимизацией и watch-time-оптимизацией. Сильный — рассказывает, что в streaming основная метрика — engaged minutes / retention, что content-driven эффекты (релизы) drive recsys, что freshness важнее tail-content. Прочитай блоги Netflix Tech и статьи Яндекса по рекомендациям.
CV / NLP fluency. Не обязательно эксперт, но рабочий минимум: Transformer-архитектуры, attention, основные предобученные модели, fine-tuning. Слабый кандидат не знает разницу между encoder и encoder-decoder архитектурами. Сильный — может рассказать про cross-attention в video transformer и почему он работает.
K8s. Слабый кандидат: «деплоил через docker-compose, K8s знаю в теории». Сильный: «делал rolling deployment, настраивал HPA на CPU/RPS, мониторил поды через Prometheus + Grafana». Без personal hands-on с K8s сложно пройти production-секцию.
Catboost / PyTorch / Python. Стандарт стека. Сильный кандидат знает quirks Catboost (ordered boosting, обработка категориалок, GPU-режим), может писать кастомные training loops в PyTorch, понимает Python-perf трюки (numpy/numba, multiprocessing).
Как готовиться: план
За 6-8 недель до собеседования:
- Неделя 1-2 — Python + ML + recommendation. LeetCode Medium 30+ задач, recsys, бустинги. Параллельно прорешай вопросы по Python, ML и SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. Python для DS, ML-теория.
- Неделя 3 — K8s + Docker. Подними хотя бы 1 модель в K8s.
- Неделя 4 — MLOps + feature stores. MLOps, Feature stores.
- Неделя 5 — System design + video AI. Model serving.
- Неделя 6 — Monitoring + deployment. Monitoring drift.
- Неделя 7-8 — Mocks + behavioral. Mock-интервью, 5-7 STAR-историй.
Частые ошибки
Без media domain. Кандидат рассказывает про recsys в e-commerce и не может перейти на streaming-язык: engaged minutes, watch time, content freshness, exposure fairness. Сильный ответ: «понимаю, что в streaming retention важнее acquisition, что watch time-оптимизация даёт другие модели, чем CTR-оптимизация».
Без recommendation. На ML System Design кандидат не различает retrieval и ranking, не знает про two-tower и тем более не помнит NDCG. Без understanding recsys-pipeline пройти System Design в streaming-компании невозможно. Прочитай хотя бы 3-5 системных статей: Spotify, Netflix, Yandex Дзен.
Без K8s. Кандидат говорит «деплоил через docker-compose, в K8s заходил один раз через kubectl get pods». Сильный ответ: «развернул минимум 1 свою модель в K8s с deployment, service, HPA, мониторингом». Перед собесом подними 1 модель сам.
Только notebook. Кандидаты с Jupyter-only background валятся на live coding и system design, потому что не умеют модулировать код. Перепиши свой свежий проект в виде Python-пакета с тестами — это сразу видно на собесе.
Без CV / NLP. START работает с видео и текстом, и без минимум знаний (CNN, Transformer, attention, fine-tuning) на ML-теории сложно. Не надо быть экспертом, но рабочий язык должен быть твоим.
Связанные темы
- Собеседование на ML Engineer
- MLOps
- Feature stores
- Model serving
- Monitoring и drift
- Deployment strategies
FAQ
Удалёнка в START для MLE?
Гибрид и удалёнка распространены.
Зарплатные вилки 2026?
Middle MLE: 240-370k. Senior: 370-560k.
Английский нужен?
Базовый — желательно.
Сколько этапов?
5-6 этапов, 3-4 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.