Собеседование на Data Scientist / ML в VK
Содержание:
Почему VK — особенный работодатель для DS
VK — экосистема социальных и контентных продуктов: VK, OK, Mail.ru, Дзен, VK Видео, VK Музыка, VK Звонки, Облако Mail. DS работает с огромным объёмом поведенческих и контентных данных. Команды: рекомендательные системы лент, ранжирование, антифрод (спам, накрутки), NLP (модерация контента), CV (изображения), audio/video ML, advertising.
Особенность: соцсети — это сетевые эффекты. Любая модель влияет на дистрибуцию контента, которая влияет на поведение юзеров, что меняет данные для следующей модели. Эксперименты сложнее, чем в e-commerce. Многие DS в VK имеют research-фокус, публикуются на конференциях. Актуальные вакансии — на странице карьеры VK.
Информация в статье основана на публичных источниках и опыте кандидатов. Формат собеседования отличается по командам и грейдам. Уточняйте у рекрутера.
Этапы собеседования
1. Скрининг с рекрутером (30 минут)
Опыт, мотивация. Особенности VK:
- Опыт с recommender systems или ranking
- Знание NLP / CV (если в соответствующую команду)
- В какой продукт интересно (VK, Дзен, Видео, Музыка, Облако)
2. Алгоритмы и Python (45-60 минут)
Live-coding: LeetCode Medium, Python (pandas, NumPy, PyTorch для DL-команд).
3. ML-теория (60-90 минут)
Главный этап. Темы:
- Recommender systems (collaborative filtering, two-tower, deep retrieval)
- Ranking models (learning-to-rank, neural ranking)
- Сетевые эффекты в соцсети
- NLP (для NLP-команд): Transformer, BERT-варианты, fine-tuning
- CV (для CV-команд): CNN, Vision Transformers, segmentation
- Audio (для audio-команд): RNN, WaveNet, ASR
4. ML system design (60-90 минут)
«Спроектируй recommender для ленты ВКонтакте», «классификация спама в комментариях», «модель для модерации картинок».
5. Поведенческое (45 минут)
STAR-вопросы.
6. Финал с лидом
Стратегический разговор.
Что VK ценит в DS
- Recommender systems глубоко. В соцсети — основа продукта
- Сетевые эффекты. Понимание, как модель меняет behavior юзеров
- Контентные метрики. DAU, dwell time, engagement, retention
- Готовность к research. Чтение papers, эксперименты
- Скорость работы. Релизы быстрые
Типичные задачи и кейсы
- «Спроектируй recommender для ленты ВК. Какие фичи, модель, как валидировать»
- «Recommender показал рост engagement в A/B, но снижение retention за месяц. Гипотезы?»
- «Как замерить успех новой модели ранжирования при сетевых эффектах?»
- «Спроектируй модель детекции спама в комментариях»
- «У нас 10M активных пользователей, как обеспечить latency <50ms для recommendations?»
Как готовиться: план
- Recommender systems. Курсы, papers (Wide & Deep, DSSM, two-tower).
- Deep learning basics. Transformer, attention, embeddings.
- A/B с сетевыми эффектами. Cluster randomization, switchback.
- Алгоритмы. LeetCode Medium, не слабее.
- NLP / CV для соответствующих команд.
- STAR-истории. 6-8 готовых.
Частые ошибки
- Слабая ML-математика. В рекомендательных системах нужно понимание линейной алгебры
- Игнорировать сетевые эффекты. В соцсети A/B врёт без cluster randomization
- Не различать engagement и retention. Краткосрочный рост engagement не равен долгосрочному успеху
- Зубрить архитектуры без понимания. «Transformer» — это не магия
Связанные темы
- Собеседование на Data Scientist
- Собеседование на DS в Yandex
- Собеседование на DS в Sber AI
- CUPED для снижения дисперсии
- Causal inference: причинность vs корреляция
FAQ
Сколько этапов в собеседовании на DS в VK?
Обычно 5-7: рекрутер → алгоритмы → ML-теория → ML system design → поведенческое → финал. Срок 3-6 недель.
Нужен ли deep learning?
В NLP, CV, recsys командах — да. В classical ML и аналитических — нет.
Какие зарплаты?
Конкурентные на рынке. Зависят от команды и грейда.
Спрашивают ли исследовательский опыт?
Желателен для research-команд (Mail.ru AI Lab). Для applied DS — упор на pet-projects.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.