Собеседование на ML Engineer в Wink
Содержание:
Почему Wink — особенный работодатель для MLE
Wink — VOD-сервис «Ростелекома», уникальный на рынке тем, что объединяет современный стриминг (мобильное приложение, Smart TV) и приставочный IPTV — наследие телекомного бизнеса с десятками миллионов абонентов через ШПД. Wink интегрирован с тарифными планами Ростелекома, что создаёт уникальные паттерны cross-sell и retention. Для ML-инженера это работа в media-streaming с интересной IPTV-составляющей.
ML-системы: recommendation контента (главная, «похожее», поиск), NLP для метаданных (классификация жанров, sentiment отзывов), video AI (автоматические теги, метки сцен), retention prediction (включая cross-sell IPTV → OTT), антифрод (детекция шеринга), advertising-аналитика для AVOD-контента.
Стек: Python + Catboost для табличных задач + PyTorch для нейросетей (CV, NLP) + K8s для deployment + Hadoop для тяжёлых ETL + Greenplum как DWH + MLflow для трекинга экспериментов.
Что важно понимать про работодателя: Wink — это не классический pure-play стриминг типа Кинопоиска или Иви, это интеграция стриминга с телекомной экосистемой Ростелекома. Поэтому здесь много специфики, которой нет у конкурентов: bundle-эффекты с тарифами ШПД, телевизионное прошлое IPTV (привычки пользователей, ТВ-сценарии просмотра), сложная attribution-аналитика на стыке маркетинга телекома и маркетинга стриминга. Для MLE это шанс работать с уникальными данными — IPTV-телеметрия с десятков миллионов set-top-boxes даёт другие сигналы, чем мобильное OTT-приложение. Также Ростелеком — большая организация с устоявшимися процессами, темп решений медленнее, чем в product-startup, но масштаб задач значительный.
Актуальные вакансии — на hh.ru и сайте «Ростелекома».
Информация основана на публичных источниках и опыте кандидатов. Команды Wink используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл занимает 3-4 недели и включает 5-6 этапов. Wink — крупный медийный продукт в группе «Ростелекома». Упор на recsys и video AI с учётом IPTV-специфики.
1. HR-скрининг (30-45 минут)
Рекрутер проверяет фон: production-опыт ML (1+ лет на реальных задачах с трафиком), media / streaming / IPTV background — большой плюс. Параллельно: мотивация (почему именно медиа, почему Wink, как ощущаешь специфику телеком-стриминга), компенсационные ожидания, готовность к гибриду с офисом в Москве. Готовь питч 90 секунд: какие модели в проде, какие масштабы, какой эффект на бизнес-метрику.
2. ML-теория (60-90 минут)
Базовая секция с ведущим ML-инженером или DS. Темы: градиентный бустинг (CatBoost — как обрабатывает категориальные фичи, чем отличается от XGBoost), classical recsys-подходы (collaborative filtering, ALS, matrix factorization), two-tower retrieval для нейросетевых retrieval-моделей, ranking metrics (NDCG, MAP, MRR, recall@K), CV и NLP базовые архитектуры. В media-домене особо важно: cold-start (Wink регулярно добавляет новый контент), popularity bias, exposure fairness. Сильный кандидат отвечает с trade-offs и конкретными примерами production-кейсов; слабый — общей теорией.
Подготовка: ML-теория.
3. Python live coding (60 минут)
Live-кодинг: 2 задачи LeetCode-уровня (Medium-Hard) на алгоритмы (деревья, графы, динамика, hash map) + ML pipeline-задача (написать функцию для расчёта recall@K или NDCG, имплементировать negative sampling, отладить чужой код с утечкой train/test). Готовиться по LeetCode минимум 3-4 недели, 100+ задач.
Подготовка: Python для DS.
4. ML System Design (90 минут)
Тебе дают кейс уровня «спроектируй ранжирование главной страницы Wink», «спроектируй video metadata AI для автотегов» или «retention prediction с учётом cross-sell IPTV → OTT». Нужно: уточнить бизнес-метрику, описать архитектуру (retrieval → ranking → re-ranking), выбрать модели, продумать фичи (user history, content embeddings, IPTV-сигналы, session data), data pipeline (offline + online), A/B-план, monitoring. Сильный кандидат сразу обсуждает специфику streaming: watch-time vs CTR, freshness, exposure fairness, cold-start; учитывает masштаб (миллионы пользователей в день).
Подготовка: MLOps, Model serving, Feature stores.
5. Production / scale (60 минут)
K8s, мониторинг drift, инциденты с моделями. Кейсы про latency optimization (квантизация, distillation), про работу с Hadoop / Greenplum для тяжёлых ETL, про K8s deployment (rolling/canary, HPA). Жди вопросов про реальные кейсы — заготовь 2-3 истории с цифрами: «поднял модель ранжирования главной, +1.8% в watch time D7 на A/B, latency p99 < 150ms на 10к RPS пиковый трафик».
Подготовка: Monitoring drift, Deployment strategies.
6. Поведенческое (45 минут)
С тимлидом и/или продакт-менеджером. STAR-формат: расскажи про конфликт с продактом по приоритетам, про факап с моделью в проде, про спор по архитектуре с другим инженером. Wink — корпоративная среда Ростелекома, ценится ответственность, аккуратность, умение договариваться. Не выдумывай факапы — рассказывай честно, что было и что вынес.
Особенности по командам
Recommendation. Ядро продукта: главная страница, «похожее», «продолжить смотреть», тематические подборки. Команда работает в плотной связке с продактами и контент-аналитиками. Модели: двухбашенные нейросети для retrieval + Catboost для ранжирования. Главные челленджи: cold-start новых релизов, баланс «свежее vs популярное», explore/exploit для разной аудитории (новые подписчики vs давние IPTV-пользователи). Сюда часто берут MLE с опытом recsys в e-commerce, медиа или крупных marketplaces.
Video AI. Обработка видео-контента: автотеги, метки сцен, генерация постеров, encoding-оптимизация для разных bandwidth. Стек включает PyTorch, CLIP-like модели, video transformers. Подойдёт MLE с CV-background и интересом к обработке видео потокового масштаба.
NLP. Обработка метаданных: классификация жанров, sentiment отзывов пользователей, генерация описаний фильмов, поиск похожих по описанию. Активно работает с LLM-инфраструктурой группы. Часто пересекается с recommendation (текстовые сигналы как фичи для ранжирования). Подойдёт MLE с NLP-фокусом.
Retention ML. Прогноз churn-а от подписки Wink, propensity-модели для cross-sell (IPTV-абонент Ростелекома → подписка Wink Megogo, или mobile-user → IPTV-bundle). Уникальная задача — work на стыке OTT и телекома. Подойдёт MLE с интересом к retention и опытом в телеком/banking churn.
IPTV / Smart TV. Уникальная команда: приставочная аудитория, bundle-эффекты с тарифами Ростелекома, отличающиеся паттерны просмотра (длинные TV-сессии vs короткие mobile). Аналитика основана на телеметрии с set-top-box, что даёт другие сигналы, чем мобильный OTT. Подойдёт MLE с интересом к IPTV-специфике и готовностью работать с тяжёлой инфраструктурой телекома.
Что Wink ценит в MLE
Production ML. Базовое требование. Слабый кандидат показывает Kaggle-кейсы; сильный — production-истории с эффектом на бизнес-метрику. Пример: «поднял ranking-модель для главной Wink, +2.1% в watch time D7 на A/B-тесте на 1.5М DAU, latency p99 < 180ms, продакшен на K8s с canary на 5% трафика, postgres + redis для feature store». Готовь 2-3 таких истории.
Media / streaming / IPTV context. Понимание bundle-эффектов, специфики stream-вместо-OTT, watch time vs CTR метрик, freshness в подборках, exposure fairness. IPTV-опыт — большой плюс, потому что таких специалистов мало. Слабый кандидат не различает OTT-streaming от классического IPTV; сильный — понимает, как меняется поведение пользователя на set-top-box vs приложении.
CV / NLP fluency. Не обязательно эксперт в обоих, но базовый язык должен быть твоим. Transformer-архитектуры, attention, основные предобученные модели (CLIP, BERT, sentence-transformers), fine-tuning. Сильный кандидат может объяснить, почему video transformers работают лучше CNN для temporal задач.
K8s. Без K8s сложно. Сильный: «деплоил в K8s с helm, делал rolling updates, понимаю resource limits и HPA, настраивал readiness/liveness probes для ML-сервиса». Перед собесом подними локально 1 модель в K8s, чтобы говорить от опыта.
Catboost / PyTorch / Python. Стандарт стека. Слабый кандидат знает один из трёх; сильный — свободно владеет всеми и понимает, когда что применять. CatBoost для табличных задач (recsys-ranking, retention), PyTorch для нейросетей (CV, NLP, two-tower retrieval), Python — основной язык.
Как готовиться: план
За 6-8 недель до собеседования:
- Неделя 1-2 — Python + ML + recommendation. LeetCode Medium 30+ задач, recsys, бустинги. Параллельно прорешай вопросы по Python, ML и SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. Python для DS, ML-теория.
- Неделя 3 — K8s + Docker. Подними хотя бы 1 модель в K8s.
- Неделя 4 — MLOps + feature stores. MLOps, Feature stores.
- Неделя 5 — System design + video AI. Model serving.
- Неделя 6 — Monitoring + deployment. Monitoring drift.
- Неделя 7-8 — Mocks + behavioral. Mock-интервью, 5-7 STAR-историй.
Частые ошибки
Без media / IPTV domain. Кандидат не различает watch time от CTR, не понимает экспозиционные эффекты в подборках. Что работает: прочитать 3-5 статей про recommendation в стриминге (Netflix Tech Blog, Spotify Engineering, статьи Кинопоиска), посмотреть, как они оптимизируют watch time и борются с popularity bias.
Без recommendation. Без recsys-specifics на System Design сразу видно: кандидат предлагает классификационную модель там, где нужен ranking, не различает retrieval и ranking стадии, не понимает offline vs online метрик. Что работает: за 2 недели до собеса прорешать 3-5 recsys-кейсов, разобрать MovieLens-датасет, освежить ALS/MF/two-tower.
Без K8s. «Деплоил через docker-compose» — для production ML на масштабе Wink этого мало. Сильный: «деплоил в K8s, делал rolling, понимаю HPA, разбираюсь с networking». Что работает: за 2 недели до собеса поднять локально 1 модель в K8s.
Только notebook. Кандидаты с Jupyter-only валятся на live-coding и system design. Что работает: переписать 1-2 свежих проекта в виде Python-пакетов с тестами и CI.
Без CV / NLP. Без минимальных знаний transformer-архитектур и embeddings — отвалишься на System Design в задачах про video AI или text features. Что работает: пройтись по основным архитектурам (BERT, CLIP, video transformers) за неделю, понимать attention и self-supervised pretraining.
Связанные темы
- Собеседование на ML Engineer
- MLOps
- Feature stores
- Model serving
- Monitoring и drift
- Deployment strategies
FAQ
Удалёнка в Wink для MLE?
Гибрид и удалёнка распространены.
Зарплатные вилки 2026?
Middle MLE: 260-400k. Senior: 400-620k.
Английский нужен?
Базовый — желательно.
Сколько этапов?
5-6 этапов, 3-4 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.