Собеседование на Data Scientist в Яндекс Музыке
Содержание:
Почему Яндекс Музыка — особенный работодатель для DS
Яндекс Музыка — главный audio-стриминг РФ в составе Плюса. DS работает над recsys треков и плейлистов, audio embeddings, классификацией жанров, прогнозом skip rate, ranking в поиске. Огромный event-data: 100M+ прослушиваний в день.
Особенность: audio recsys — это специфический домен. Track length короткий (3-4 минуты), пользователь часто переключает, plateau в feedback (just play vs love vs hate). Подробнее — на странице карьеры Яндекса.
Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.
Этапы собеседования
1. Скрининг (30-45 минут)
Опыт, мотивация.
2. SQL и Python (60 минут)
SQL — senior. Python — pandas, базовый pytorch.
3. ML-теория (60-90 минут)
- Recsys: collaborative, content-based, hybrid, two-tower
- Audio embeddings высокоуровнево
- Ranking: NDCG, MRR
- Implicit feedback (skip как negative)
4. ML system design (60 минут)
«Recsys плейлистов», «sequence model для следующего трека», «cold start».
5. Поведенческое + финал
STAR + культурный фит.
Что Яндекс Музыка ценит в DS
- Recsys deep. Including sequence models.
- Implicit feedback. Skip / play / repeat — sources.
- Embeddings. Audio + collaborative.
- A/B-mindset.
- Экосистема. Музыка ↔ Алиса ↔ Колонка.
Типичные задачи и кейсы
- «Recsys плейлиста «На каждый день»»
- «Sequence model для следующего трека»
- «Cold start новых пользователей»
- «Эффект эксклюзива на retention»
- «Audio embeddings: classifying mood жанра»
Как готовиться: план
- Recsys deep. Sequence models (BST, SASRec).
- Embeddings. Audio + collaborative.
- Implicit feedback. BPR, weighted MF.
- A/B. Holdout vs A/B.
- SQL. Senior.
Частые ошибки
- Игнорировать implicit feedback. Audio = implicit.
- Слабая SQL. Senior.
- Не учитывать экосистему. Алиса, Колонка — продолжение Музыки.
Связанные темы
- Собеседование на DS в Яндекс
- Собеседование на DS в Кинопоиске
- Embeddings на собесе DS
- Ranking метрики (NDCG)
- Собеседование на PM в Я.Музыке
FAQ
Сколько этапов?
Обычно 5-6. Срок 4-6 недель.
Нужен ли опыт в audio?
Желателен recsys-опыт.
Какой уровень SQL?
Senior.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.