Собеседование на Data Scientist в HeadHunter
Содержание:
Почему HeadHunter — особенный работодатель для DS
HeadHunter (hh.ru) — крупнейший российский сервис поиска работы. DS работает с двусторонним рынком (соискатели + работодатели), recsys вакансий и резюме, NLP-извлечением навыков и опыта, ранжированием результатов поиска, классификацией откликов.
Особенность: matching — основная задача. С одной стороны миллионы резюме, с другой сотни тысяч вакансий. Каждый день нужно показать каждому соискателю релевантные вакансии и каждому работодателю качественных кандидатов. NLP + recsys + ranking — главные инструменты. Подробнее — на странице карьеры HeadHunter.
Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.
Этапы собеседования
1. Скрининг с рекрутером (30 минут)
Опыт, мотивация. Специфика:
- Был ли опыт с recsys / NLP / matching
- Знание классического ML + базовый deep learning
- Понимание двустороннего рынка
2. SQL и Python (60 минут)
SQL — middle. Python — pandas, sklearn, базовый pytorch.
3. ML-теория (60-90 минут)
- Recsys: collaborative filtering, content-based, hybrid, learning-to-rank
- NLP: эмбеддинги (Word2Vec, BERT), классификация, NER
- Метрики ranking: NDCG, MRR, recall@k
- Cold start, evaluation offline vs online
- Two-tower models, embeddings retrieval
4. ML system design (60 минут)
«Спроектируй recommender вакансий», «классификация откликов на «подходит/не подходит»», «извлечение skills из резюме».
5. Поведенческое + финал
STAR + стратегический разговор.
Что HeadHunter ценит в DS
- Recsys. Recommender в двустороннем рынке.
- NLP. Эмбеддинги, NER, классификация.
- Ranking. Learning-to-rank, NDCG.
- Двусторонний матчинг. Понимание обоих сторон.
- A/B-mindset. Эксперименты на миллионах сессий.
Типичные задачи и кейсы
- «Спроектируй recommender вакансий для соискателя»
- «Recommender кандидатов для работодателя»
- «Классификация откликов на «подходит/не подходит»»
- «Извлечение навыков из резюме: NER + классификация»
- «Cold start для нового соискателя: какие вакансии показать»
Как готовиться: план
- Recsys. Collaborative, content-based, hybrid, learning-to-rank.
- NLP. Эмбеддинги (Word2Vec, BERT), NER, классификация.
- Ranking. Метрики (NDCG, MRR, recall@k), learning-to-rank.
- Two-tower modeling. Retrieval + ranking pipeline.
- A/B на recsys. Offline vs online metrics, propensity scoring.
Частые ошибки
- Recsys без cold start. Новые соискатели / вакансии — постоянно.
- Игнорировать ranking метрики. AUC ≠ recsys. Учите NDCG.
- Слабая NLP. В hh резюме = тексты. Без NLP — нерелевантный кандидат.
- A/B на recsys без guardrail. Высокий CTR может убить долгосрочные метрики.
Связанные темы
- Собеседование на Data Scientist
- Embeddings на собесе DS
- Ranking метрики (NDCG)
- Holdout vs A/B на практике
- Собеседование на PM в HH
FAQ
Сколько этапов в собеседовании на DS в HeadHunter?
Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 4-6 недель.
Нужен ли опыт в recsys / NLP?
Желателен. Релевантным считается опыт e-com, медиа с матчингом.
Какой уровень SQL?
Уверенный middle.
Спрашивают ли deep learning?
Для recsys команд — обязательно базовое (two-tower, embeddings retrieval).
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.