Собеседование на Data Scientist в Кинопоиске

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Кинопоиск — особенный работодатель для DS

Кинопоиск — главный медиа-сервис Яндекса. DS работает над recsys фильмов / сериалов, ranking главной страницы, NLP анализа отзывов и пользовательских рейтингов, classification жанров. Главные данные — поведенческие (поиск, просмотр, оценки), плюс контентные (метаданные фильмов).

Особенность: продукт в экосистеме Плюса — модель оптимизируется не только под Кинопоиск, но и под общую retention экосистемы. Подробнее — на странице карьеры Яндекса.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг (30-45 минут)

Опыт, мотивация.

2. SQL и Python (60 минут)

SQL — senior. Python — pandas, базовый pytorch.

3. ML-теория (60-90 минут)

  • Recsys: collaborative, content-based, hybrid, two-tower
  • Ranking: learning-to-rank, NDCG, MRR
  • Embeddings (Word2Vec, BERT)
  • A/B-эксперименты

4. ML system design (60 минут)

«Recsys главной страницы», «ranking результатов поиска», «NLP-анализ отзывов».

5. Поведенческое + финал

STAR + культурный фит.

Что Кинопоиск ценит в DS

  • Recsys. Глубоко.
  • Ranking. Learning-to-rank, NDCG.
  • Embeddings. Для content-based.
  • A/B-mindset. Эксперименты — стандарт.
  • Экосистема. Понимание Плюса.

Типичные задачи и кейсы

  • «Recsys главной страницы»
  • «Ranking результатов поиска»
  • «NLP анализ отзывов на жанровые категории»
  • «Прогноз rating нового фильма по контенту»
  • «Эффект эксклюзива на retention Плюса»
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. Recsys deep. Collaborative, content-based, two-tower.
  2. Ranking. Learning-to-rank, NDCG.
  3. Embeddings. Word2Vec, BERT.
  4. A/B. Holdout vs A/B.
  5. SQL. Senior.

Частые ошибки

  • AUC ≠ recsys. NDCG, MRR.
  • Игнорировать экосистему. Кинопоиск ↔ Плюс.
  • Слабая SQL. Senior-уровень.

Связанные темы

FAQ

Сколько этапов?

Обычно 5-6. Срок 4-6 недель.

Нужен ли опыт в OTT / media?

Желателен.

Какой уровень SQL?

Уверенный senior.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.