Собеседование на Data Scientist в Okko
Содержание:
Почему Okko — особенный работодатель для DS
Okko — крупный OTT-сервис РФ. DS работает над recsys фильмов и сериалов, прогнозом churn подписки, классификацией контента, NLP анализом отзывов. Главное оружие — embeddings + collaborative filtering на огромных event-данных.
Особенность: video streaming — sparse interaction data, длинные циклы решения (фильм 2 часа, сериал — недели). Подробнее — на странице карьеры Okko.
Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.
Этапы собеседования
1. Скрининг (30 минут)
Опыт, мотивация, понимание recsys.
2. SQL и Python (60 минут)
SQL — middle. Python — pandas, sklearn, базовый pytorch.
3. ML-теория (60-90 минут)
- Recsys: collaborative, content-based, hybrid, two-tower
- Метрики ranking: NDCG, MRR, recall@k
- Embeddings (Word2Vec, BERT для NLP)
- Cold start
4. ML system design (60 минут)
«Recsys фильмов», «прогноз churn подписки», «classification жанров».
5. Поведенческое + финал
STAR + культурный фит.
Что Okko ценит в DS
- Recsys. Collaborative + content-based.
- Метрики ranking. NDCG, MRR.
- Embeddings. Для content-based recsys.
- A/B на длинных циклах. Holdout.
- Pragmatism. Простая модель в проде.
Типичные задачи и кейсы
- «Recsys фильмов для главной страницы»
- «Прогноз churn подписки за 30 дней»
- «Classification контента: жанры, теги»
- «Cold start новых подписчиков»
- «Эффект эксклюзива на retention»
Как готовиться: план
- Recsys. Collaborative, content-based, hybrid, two-tower.
- Метрики ranking. NDCG, MRR, recall@k.
- Embeddings. Word2Vec, BERT.
- A/B на длинных циклах. Holdout vs A/B.
- SQL. Уверенный middle.
Частые ошибки
- AUC ≠ recsys. Учи NDCG, MRR.
- A/B на короткие сроки. В OTT эффект через недели.
- Слабая SQL. Уверенный middle.
Связанные темы
- Собеседование на DS в Кинопоиске
- Embeddings на собесе DS
- Ranking метрики (NDCG)
- Holdout vs A/B на практике
- Собеседование на PM в Okko
FAQ
Сколько этапов?
Обычно 5-6. Срок 4-6 недель.
Нужен ли OTT-опыт?
Желателен.
Какой уровень SQL?
Уверенный middle.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.