Собеседование на Data Scientist в Кинопоиске
Содержание:
Почему Кинопоиск — особенный работодатель для DS
Кинопоиск — главный медиа-сервис Яндекса. DS работает над recsys фильмов / сериалов, ranking главной страницы, NLP анализа отзывов и пользовательских рейтингов, classification жанров. Главные данные — поведенческие (поиск, просмотр, оценки), плюс контентные (метаданные фильмов).
Особенность: продукт в экосистеме Плюса — модель оптимизируется не только под Кинопоиск, но и под общую retention экосистемы. Подробнее — на странице карьеры Яндекса.
Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.
Этапы собеседования
1. Скрининг (30-45 минут)
Опыт, мотивация.
2. SQL и Python (60 минут)
SQL — senior. Python — pandas, базовый pytorch.
3. ML-теория (60-90 минут)
- Recsys: collaborative, content-based, hybrid, two-tower
- Ranking: learning-to-rank, NDCG, MRR
- Embeddings (Word2Vec, BERT)
- A/B-эксперименты
4. ML system design (60 минут)
«Recsys главной страницы», «ranking результатов поиска», «NLP-анализ отзывов».
5. Поведенческое + финал
STAR + культурный фит.
Что Кинопоиск ценит в DS
- Recsys. Глубоко.
- Ranking. Learning-to-rank, NDCG.
- Embeddings. Для content-based.
- A/B-mindset. Эксперименты — стандарт.
- Экосистема. Понимание Плюса.
Типичные задачи и кейсы
- «Recsys главной страницы»
- «Ranking результатов поиска»
- «NLP анализ отзывов на жанровые категории»
- «Прогноз rating нового фильма по контенту»
- «Эффект эксклюзива на retention Плюса»
Как готовиться: план
- Recsys deep. Collaborative, content-based, two-tower.
- Ranking. Learning-to-rank, NDCG.
- Embeddings. Word2Vec, BERT.
- A/B. Holdout vs A/B.
- SQL. Senior.
Частые ошибки
- AUC ≠ recsys. NDCG, MRR.
- Игнорировать экосистему. Кинопоиск ↔ Плюс.
- Слабая SQL. Senior-уровень.
Связанные темы
- Собеседование на DS в Яндекс
- Собеседование на DS в Okko
- Embeddings на собесе DS
- Ranking метрики (NDCG)
- Собеседование на PM в Кинопоиске
FAQ
Сколько этапов?
Обычно 5-6. Срок 4-6 недель.
Нужен ли опыт в OTT / media?
Желателен.
Какой уровень SQL?
Уверенный senior.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.