Собеседование на Data Scientist в Яндекс Музыке

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Яндекс Музыка — особенный работодатель для DS

Яндекс Музыка — главный audio-стриминг РФ в составе Плюса. DS работает над recsys треков и плейлистов, audio embeddings, классификацией жанров, прогнозом skip rate, ranking в поиске. Огромный event-data: 100M+ прослушиваний в день.

Особенность: audio recsys — это специфический домен. Track length короткий (3-4 минуты), пользователь часто переключает, plateau в feedback (just play vs love vs hate). Подробнее — на странице карьеры Яндекса.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг (30-45 минут)

Опыт, мотивация.

2. SQL и Python (60 минут)

SQL — senior. Python — pandas, базовый pytorch.

3. ML-теория (60-90 минут)

  • Recsys: collaborative, content-based, hybrid, two-tower
  • Audio embeddings высокоуровнево
  • Ranking: NDCG, MRR
  • Implicit feedback (skip как negative)

4. ML system design (60 минут)

«Recsys плейлистов», «sequence model для следующего трека», «cold start».

5. Поведенческое + финал

STAR + культурный фит.

Что Яндекс Музыка ценит в DS

  • Recsys deep. Including sequence models.
  • Implicit feedback. Skip / play / repeat — sources.
  • Embeddings. Audio + collaborative.
  • A/B-mindset.
  • Экосистема. Музыка ↔ Алиса ↔ Колонка.

Типичные задачи и кейсы

  • «Recsys плейлиста «На каждый день»»
  • «Sequence model для следующего трека»
  • «Cold start новых пользователей»
  • «Эффект эксклюзива на retention»
  • «Audio embeddings: classifying mood жанра»
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. Recsys deep. Sequence models (BST, SASRec).
  2. Embeddings. Audio + collaborative.
  3. Implicit feedback. BPR, weighted MF.
  4. A/B. Holdout vs A/B.
  5. SQL. Senior.

Частые ошибки

  • Игнорировать implicit feedback. Audio = implicit.
  • Слабая SQL. Senior.
  • Не учитывать экосистему. Алиса, Колонка — продолжение Музыки.

Связанные темы

FAQ

Сколько этапов?

Обычно 5-6. Срок 4-6 недель.

Нужен ли опыт в audio?

Желателен recsys-опыт.

Какой уровень SQL?

Senior.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.