Собеседование на Data Scientist в HeadHunter

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему HeadHunter — особенный работодатель для DS

HeadHunter (hh.ru) — крупнейший российский сервис поиска работы. DS работает с двусторонним рынком (соискатели + работодатели), recsys вакансий и резюме, NLP-извлечением навыков и опыта, ранжированием результатов поиска, классификацией откликов.

Особенность: matching — основная задача. С одной стороны миллионы резюме, с другой сотни тысяч вакансий. Каждый день нужно показать каждому соискателю релевантные вакансии и каждому работодателю качественных кандидатов. NLP + recsys + ranking — главные инструменты. Подробнее — на странице карьеры HeadHunter.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30 минут)

Опыт, мотивация. Специфика:

  • Был ли опыт с recsys / NLP / matching
  • Знание классического ML + базовый deep learning
  • Понимание двустороннего рынка

2. SQL и Python (60 минут)

SQL — middle. Python — pandas, sklearn, базовый pytorch.

3. ML-теория (60-90 минут)

  • Recsys: collaborative filtering, content-based, hybrid, learning-to-rank
  • NLP: эмбеддинги (Word2Vec, BERT), классификация, NER
  • Метрики ranking: NDCG, MRR, recall@k
  • Cold start, evaluation offline vs online
  • Two-tower models, embeddings retrieval

4. ML system design (60 минут)

«Спроектируй recommender вакансий», «классификация откликов на «подходит/не подходит»», «извлечение skills из резюме».

5. Поведенческое + финал

STAR + стратегический разговор.

Что HeadHunter ценит в DS

  • Recsys. Recommender в двустороннем рынке.
  • NLP. Эмбеддинги, NER, классификация.
  • Ranking. Learning-to-rank, NDCG.
  • Двусторонний матчинг. Понимание обоих сторон.
  • A/B-mindset. Эксперименты на миллионах сессий.

Типичные задачи и кейсы

  • «Спроектируй recommender вакансий для соискателя»
  • «Recommender кандидатов для работодателя»
  • «Классификация откликов на «подходит/не подходит»»
  • «Извлечение навыков из резюме: NER + классификация»
  • «Cold start для нового соискателя: какие вакансии показать»
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. Recsys. Collaborative, content-based, hybrid, learning-to-rank.
  2. NLP. Эмбеддинги (Word2Vec, BERT), NER, классификация.
  3. Ranking. Метрики (NDCG, MRR, recall@k), learning-to-rank.
  4. Two-tower modeling. Retrieval + ranking pipeline.
  5. A/B на recsys. Offline vs online metrics, propensity scoring.

Частые ошибки

  • Recsys без cold start. Новые соискатели / вакансии — постоянно.
  • Игнорировать ranking метрики. AUC ≠ recsys. Учите NDCG.
  • Слабая NLP. В hh резюме = тексты. Без NLP — нерелевантный кандидат.
  • A/B на recsys без guardrail. Высокий CTR может убить долгосрочные метрики.

Связанные темы

FAQ

Сколько этапов в собеседовании на DS в HeadHunter?

Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 4-6 недель.

Нужен ли опыт в recsys / NLP?

Желателен. Релевантным считается опыт e-com, медиа с матчингом.

Какой уровень SQL?

Уверенный middle.

Спрашивают ли deep learning?

Для recsys команд — обязательно базовое (two-tower, embeddings retrieval).

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.