Собеседование на Data Scientist / ML в VK

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему VK — особенный работодатель для DS

VK — экосистема социальных и контентных продуктов: VK, OK, Mail.ru, Дзен, VK Видео, VK Музыка, VK Звонки, Облако Mail. DS работает с огромным объёмом поведенческих и контентных данных. Команды: рекомендательные системы лент, ранжирование, антифрод (спам, накрутки), NLP (модерация контента), CV (изображения), audio/video ML, advertising.

Особенность: соцсети — это сетевые эффекты. Любая модель влияет на дистрибуцию контента, которая влияет на поведение юзеров, что меняет данные для следующей модели. Эксперименты сложнее, чем в e-commerce. Многие DS в VK имеют research-фокус, публикуются на конференциях. Актуальные вакансии — на странице карьеры VK.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат собеседования отличается по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30 минут)

Опыт, мотивация. Особенности VK:

  • Опыт с recommender systems или ranking
  • Знание NLP / CV (если в соответствующую команду)
  • В какой продукт интересно (VK, Дзен, Видео, Музыка, Облако)

2. Алгоритмы и Python (45-60 минут)

Live-coding: LeetCode Medium, Python (pandas, NumPy, PyTorch для DL-команд).

3. ML-теория (60-90 минут)

Главный этап. Темы:

  • Recommender systems (collaborative filtering, two-tower, deep retrieval)
  • Ranking models (learning-to-rank, neural ranking)
  • Сетевые эффекты в соцсети
  • NLP (для NLP-команд): Transformer, BERT-варианты, fine-tuning
  • CV (для CV-команд): CNN, Vision Transformers, segmentation
  • Audio (для audio-команд): RNN, WaveNet, ASR

4. ML system design (60-90 минут)

«Спроектируй recommender для ленты ВКонтакте», «классификация спама в комментариях», «модель для модерации картинок».

5. Поведенческое (45 минут)

STAR-вопросы.

6. Финал с лидом

Стратегический разговор.

Что VK ценит в DS

  • Recommender systems глубоко. В соцсети — основа продукта
  • Сетевые эффекты. Понимание, как модель меняет behavior юзеров
  • Контентные метрики. DAU, dwell time, engagement, retention
  • Готовность к research. Чтение papers, эксперименты
  • Скорость работы. Релизы быстрые

Типичные задачи и кейсы

  • «Спроектируй recommender для ленты ВК. Какие фичи, модель, как валидировать»
  • «Recommender показал рост engagement в A/B, но снижение retention за месяц. Гипотезы?»
  • «Как замерить успех новой модели ранжирования при сетевых эффектах?»
  • «Спроектируй модель детекции спама в комментариях»
  • «У нас 10M активных пользователей, как обеспечить latency <50ms для recommendations?»
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. Recommender systems. Курсы, papers (Wide & Deep, DSSM, two-tower).
  2. Deep learning basics. Transformer, attention, embeddings.
  3. A/B с сетевыми эффектами. Cluster randomization, switchback.
  4. Алгоритмы. LeetCode Medium, не слабее.
  5. NLP / CV для соответствующих команд.
  6. STAR-истории. 6-8 готовых.

Частые ошибки

  • Слабая ML-математика. В рекомендательных системах нужно понимание линейной алгебры
  • Игнорировать сетевые эффекты. В соцсети A/B врёт без cluster randomization
  • Не различать engagement и retention. Краткосрочный рост engagement не равен долгосрочному успеху
  • Зубрить архитектуры без понимания. «Transformer» — это не магия

Связанные темы

FAQ

Сколько этапов в собеседовании на DS в VK?

Обычно 5-7: рекрутер → алгоритмы → ML-теория → ML system design → поведенческое → финал. Срок 3-6 недель.

Нужен ли deep learning?

В NLP, CV, recsys командах — да. В classical ML и аналитических — нет.

Какие зарплаты?

Конкурентные на рынке. Зависят от команды и грейда.

Спрашивают ли исследовательский опыт?

Желателен для research-команд (Mail.ru AI Lab). Для applied DS — упор на pet-projects.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.