Собеседование на Data Scientist в HeadHunter

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему HH — особенный работодатель для DS

HeadHunter — крупнейшая рекрутинговая площадка СНГ. DS-команда работает над search ranking (vacancy ↔ candidate matching), рекомендациями вакансий, антифродом против фейковых вакансий, NLP для обработки текстов резюме и вакансий.

Стек: Python + PyTorch + scikit-learn + LightGBM + Spark + ClickHouse + MLflow. Доменная специфика — HR-tech, two-sided marketplace (соискатель + работодатель).

Актуальные вакансии — на hh.ru/employer/1455.

Информация основана на публичных источниках и опыте кандидатов. Команды HH используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

1. HR-скрининг (30-45 минут)

Знакомство:

  • Опыт ML, особенно ranking / recommendation / NLP
  • Стек: PyTorch / sklearn / Spark
  • Motivation: HR-tech

Питч 90 секунд: задача, данные, модель, метрика, impact.

2. ML теория (60-90 минут)

  • Классика: bias-variance, регуляризация, бустинги
  • Ranking metrics: NDCG, MAP, MRR
  • Recommendation: CF, content-based, hybrid
  • NLP базовый

Подготовка: ML-теория, NLP задачи.

3. Python + SQL (60-90 минут)

Live coding.

  • Pandas / NumPy
  • SQL window functions, оптимизация
  • Алгоритмы medium

Подготовка: Python для DS, SQL-тренажёр.

4. ML System Design (60-90 минут)

Кейсы:

  • Ranking вакансий для конкретного кандидата
  • Recommendation вакансий
  • Fraud detection
  • NLP: тэгирование вакансий, classification

Подготовка: ML system design, feature engineering.

5. Поведенческое (45-60 минут)

STAR: cross-team, ML в проде, trade-offs.

Особенности по командам

Search & Ranking: core ranking, two-sided matching.

Recommendations: push, email, homepage.

NLP: обработка текстов резюме, вакансий, classification.

Антифрод: детект фейковых вакансий и резюме.

Аналитика продукта: A/B-тесты, funnel.

Что HH ценит в DS

  • Ranking опыт. Core для HH.
  • NLP базовый. Texts — основной тип данных.
  • A/B-тесты. Дизайн + analyse.
  • Production ML. Не notebook-only.
  • Engineering culture. Code review, тесты.
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 4-6 недель:

  1. Неделя 1-2 — ML теория + Ranking + NLP. ML-теория, NLP.
  2. Неделя 3 — Python + SQL. Python для DS.
  3. Неделя 4 — System design. Two-sided marketplace кейсы. ML system design.
  4. Неделя 5 — A/B + production. A/B-тесты для DS.
  5. Неделя 6 — Mocks + behavioral.

Частые ошибки

  • Без ranking опыта. HH core.
  • Без NLP. Тексты — основной тип данных.
  • Без A/B понимания. Спросят дизайн.
  • «У меня deep learning». Pragmatism: LightGBM + features часто beats.
  • Без production. Только эксперименты — спросят deployment.

Связанные темы

FAQ

Удалёнка в HH для DS?

Гибрид часто.

Зарплатные вилки 2026?

Middle DS: 240-360k. Senior: 360-540k.

Английский нужен?

Базовый — желательно.

Сколько этапов?

4-5 этапов, 2-3 недели.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.