Собеседование на Data Scientist в Premier

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Premier — особенный работодатель для DS

Premier — российский VOD-сервис от Газпром-Медиа Холдинга, известный фокусом на оригинальный российский контент: сериалы, шоу, документальные проекты собственного производства. По размеру аудитории Premier меньше Иви или Okko, но активно растёт и инвестирует в оригинал-контент, что создаёт уникальную DS-специфику: запуск нового шоу — это не «добавили в каталог», а большая маркетинговая кампания с прогнозом аудитории, оптимизацией промо, измерением long-tail-эффекта на retention. Для Data Scientist это интересный микс classical media DS (рекомендации, retention) и content-marketing DS (прогноз популярности нового тайтла, оптимизация Time-to-Watch).

ML-домены: ранжирование контента и подборок, retention prediction (особенно вокруг релизов оригинального контента — «удержит ли новый сериал подписчика после первой серии»), churn / реактивация, propensity-to-pay, NLP (модерация рецензий, классификация запросов), audience prediction для нового контента, оптимизация промо-кампаний, video-AI (теги, превью). Стек: Python, CatBoost, PyTorch, ClickHouse, Spark, Airflow, MLflow, внутренний A/B-фреймворк.

Актуальные вакансии — на hh.ru и сайте Premier.

Информация основана на публичных источниках и опыте кандидатов. Команды Premier используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

Цикл 3–5 недель и включает 4–6 этапов. Процесс менее формализован, чем у Okko (Сбер): меньше формальных секций, больше разговора по продукту. Premier — средняя по размеру компания, кандидат на собесе общается напрямую с тимлидом и командой.

1. HR-скрининг (30–45 минут)

Рекрутер проверяет фон: production-опыт DS (1+ год), интерес к медиа, причины смены работы, ожидания. Опыт в подписочных продуктах или recsys — плюс. Опыт в content marketing (прогноз популярности, аудитория) — большой плюс. Питч 60–90 секунд.

2. Тестовое задание (3–5 дней)

Чаще даётся для middle+ позиций: датасет с просмотрами, нужно построить модель recommendation, retention или прогноза аудитории. Сильные кандидаты обсуждают cold start для нового контента — это особенно актуально для Premier с упором на оригинал.

3. ML / DS-теория (60–90 минут)

С senior DS из команды. Темы: классика (бустинги, регуляризация, метрики), recommender-теория, ranking-метрики (NDCG, MAP), uplift, survival для подписочного retention. Доп. блок: time-series методы (Prophet / ARIMA) для прогноза аудитории нового шоу.

Подготовка: Классическая ML на собесе, Time series на собесе.

4. Python + SQL live-coding (60 минут)

Live: 1–2 алгоритмических задачи (LeetCode Medium-Easy), 1–2 на pandas / SQL по медиа-данным. SQL обычно классический: оконные функции, GROUP BY с фильтрами, ratio-метрики. Сложность ниже Сбер-стандарта.

Подготовка: Live-coding.

5. A/B + продуктовая секция (60–90 минут)

Спрашивают: дизайн эксперимента, sample size, MDE, ratio-метрики, peeking. Продуктовая часть: «как измерить эффект релиза нового сериала на retention», «как оптимизировать промо-кампанию», «как сегментировать платящих по жанровым предпочтениям». Готовь конкретные кейсы.

Подготовка: A/B и causal inference.

6. Поведенческое + культурный fit (30–45 минут)

С тимлидом и менеджером. STAR-формат: конфликт, факап, инициатива. Premier ценит командных игроков с интересом к контенту — на собесе часто спрашивают про любимые сериалы и про то, как ты бы измерил их эффект.

Особенности по командам

Content recommendation. Меньше команда: ранжирование на главной, подборки, «похожее». Особенность Premier — упор на оригинал-контент, поэтому модели должны корректно учитывать новизну тайтлов и эффект промо-кампаний. Подойдёт DS с recsys-background и интересом к продуктовой стороне.

Retention & subscription. Прогноз churn, реактивация, оптимизация trial, paywall. В Premier важная задача — измерение эффекта оригинал-релиза на retention: новые серии «привязывают» подписчиков, и модели должны учитывать релиз-календарь.

Content Marketing & Audience Analytics. Уникальная для Premier команда: прогноз аудитории нового шоу до релиза (using metadata, cast, жанр, исторические аналоги), оптимизация промо-кампаний, измерение долгосрочного эффекта оригинал-контента. Mix time-series, ML и продуктовой аналитики. Подойдёт DS с интересом к контенту и навыками прогнозирования.

NLP & Search. Меньше команда: модерация рецензий, классификация запросов, поиск. Подойдёт DS с NLP-background.

Marketing & UA. Атрибуция, прогноз ROI кампаний, performance-маркетинг. Меньше по объёму данных, чем у крупных конкурентов, но проще итерировать решения.

Pricing & Subscription Promo. Меньше команда: оптимизация триальных сценариев, дифференцированные офферы для разных аудиторий, A/B-эксперименты с длительностью триала и ценой. Тесная связка с продуктом и маркетингом.

Audience Insights & Editorial Support. Поддержка редакторов оригинал-контента данными: какие жанры растут, какие сегменты аудитории недо-обслужены, какие комбинации актёр-режиссёр-сюжет работают. Подойдёт DS с интересом к качественной аналитике контента и готовностью работать в тесном контакте с творческими командами.

Long-term Retention Research. Исследовательская команда вокруг долгосрочных эффектов оригинал-контента: как одна успешная серия привязывает подписчика на 6–12 месяцев, как корректно атрибутировать LTV между несколькими шоу, которые подписчик смотрит. Сильно завязана на causal inference и uplift-моделирование.

Что Premier ценит в DS

Интерес к контенту. Это медиа-компания. Кандидат, который не смотрит сериалы и шоу, выглядит чужеродно. На собесе спросят: «какой последний сериал смотрел и почему», «что ты бы сделал с метаданными контента, чтобы улучшить рекомендации». Strong answer — конкретика, weak — обобщения.

Самостоятельность. Команды компактные, DS должен брать задачу и доводить до результата без длинного брифинга. Готовность принимать решения с неполным контекстом — must.

Гибкость в продукте. Premier постоянно экспериментирует с механиками. Кандидат, привыкший работать только по жёстко согласованному ТЗ, не подойдёт.

Цифры в кейсах. Weak: «обучил retention-модель». Strong: «обучил retention-prediction для подписчиков с учётом релиз-календаря оригинала, в A/B на 30% за 21 день +1.8pp D30-retention в группе exposed-to-original, p < 0.01, после раскатки эффект сохранился; бизнес-эффект — около +X тыс. retained subscribers в квартал». Цифры обязательны.

Кросс-функциональная работа. Близкая связка с редакторами оригинал-контента, маркетингом, продуктом. Готовность объяснять модели non-tech и слышать обратную связь от не-DS коллег — важно.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

Минимум 4–6 недель. Неделя 1–2: ML-теория (классика, recsys, time-series). Неделя 3: LeetCode + pandas (40–50 задач). Неделя 4: SQL — оконки, retention, ratio-метрики. Неделя 5: A/B и продуктовая аналитика. Неделя 6: подпишись на Premier, посмотри 1–2 оригинал-сериала, прочитай статьи про прогноз аудитории VOD-контента, подготовь STAR-истории.

Для тренировки реальных вопросов с DS-собесов — открывай Карьерник: 1500+ задач по SQL, Python, A/B, статистике, продуктовой аналитике и ML по темам и сложности.

Частые ошибки

Первая — отсутствие интереса к контенту. Premier — это компания про сериалы и шоу. Кандидат, который на вопрос «что смотришь» отвечает «я не смотрю VOD», даёт сильный негативный сигнал. Лучше посмотри 1–2 проекта Premier перед собесом.

Вторая — recsys-из-учебника без понимания content-marketing-специфики. В Premier модели должны учитывать релиз-календарь оригинал-контента. Если ты предлагаешь classical CF без обсуждения новизны, это сигнал, что не понимаешь продукт.

Третья — игнорирование time-series-компоненты. Прогноз аудитории нового шоу — это time-series задача с учётом метаданных, и в Premier она реальная.

Четвёртая — слабая разница между классическим VOD-recsys и оригинал-content-промо. Это разные задачи: одна — про долгий каталог, другая — про разовые большие релизы. Кандидаты часто применяют одну и ту же архитектуру модели для обеих, и это сразу заметно интервьюеру: оригинал-промо требует time-decay-фичей, учёта релиз-календаря и иногда даже специфики жанровых волн, тогда как обычный recsys больше про стабильное долговременное смотрение пользователя.

Пятая — отсутствие конкретики при обсуждении сегментации. На вопрос «как ты сегментируешь подписчиков» слабый ответ: «k-means на поведенческих фичах». Сильный — «комбинация бизнес-правил по жанровым предпочтениям и uplift-кластеризации для оценки чувствительности к промо-кампаниям конкретного типа контента; для каждого сегмента отдельная стратегия retention».

Связанные темы

FAQ

Сколько этапов в собесе DS в Premier?

4–6 этапов: HR-скрининг, тестовое задание (для middle+), ML / DS-теория, Python + SQL live-coding, A/B + продуктовая секция, поведенческое. Цикл — 3–5 недель.

Нужен ли опыт именно в медиа?

Желателен. Если нет — установи Premier перед собесом, посмотри 1–2 оригинал-проекта, прочитай 2–3 статьи про content marketing в VOD.

Сложнее или проще, чем в Okko / Иви?

Процесс короче и менее формализован, но требования к продуктовому мышлению и интересу к контенту — выше. Технически уровень сопоставим с Иви, ниже Okko / Сбер.

Какой английский нужен?

B1–B2 минимум. Внутренние коммуникации в основном на русском, документация частично на английском.

Какой грейд DS подходит для входа в Premier?

Чаще middle и senior. Junior-роли встречаются редко, и часто это позиции в команде Audience Analytics с возможностью роста в полноценного DS через 1–2 года. Если ты junior — лучше идти через тестовое задание, где можно показать структурированный подход и интерес к контенту.

Сколько платят DS в Premier?

Зависит от грейда. Для middle DS — на уровне крупных RU tech-компаний, для senior — близко к рынку. Content marketing DS обычно платит выше, чем общая аналитика, из-за специфики и спроса.