Собеседование на Data Scientist в HeadHunter
Содержание:
Почему HH — особенный работодатель для DS
HeadHunter — крупнейшая рекрутинговая площадка СНГ. DS-команда работает над search ranking (vacancy ↔ candidate matching), рекомендациями вакансий, антифродом против фейковых вакансий, NLP для обработки текстов резюме и вакансий.
Стек: Python + PyTorch + scikit-learn + LightGBM + Spark + ClickHouse + MLflow. Доменная специфика — HR-tech, two-sided marketplace (соискатель + работодатель).
Актуальные вакансии — на hh.ru/employer/1455.
Информация основана на публичных источниках и опыте кандидатов. Команды HH используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
1. HR-скрининг (30-45 минут)
Знакомство:
- Опыт ML, особенно ranking / recommendation / NLP
- Стек: PyTorch / sklearn / Spark
- Motivation: HR-tech
Питч 90 секунд: задача, данные, модель, метрика, impact.
2. ML теория (60-90 минут)
- Классика: bias-variance, регуляризация, бустинги
- Ranking metrics: NDCG, MAP, MRR
- Recommendation: CF, content-based, hybrid
- NLP базовый
Подготовка: ML-теория, NLP задачи.
3. Python + SQL (60-90 минут)
Live coding.
- Pandas / NumPy
- SQL window functions, оптимизация
- Алгоритмы medium
Подготовка: Python для DS, SQL-тренажёр.
4. ML System Design (60-90 минут)
Кейсы:
- Ranking вакансий для конкретного кандидата
- Recommendation вакансий
- Fraud detection
- NLP: тэгирование вакансий, classification
Подготовка: ML system design, feature engineering.
5. Поведенческое (45-60 минут)
STAR: cross-team, ML в проде, trade-offs.
Особенности по командам
Search & Ranking: core ranking, two-sided matching.
Recommendations: push, email, homepage.
NLP: обработка текстов резюме, вакансий, classification.
Антифрод: детект фейковых вакансий и резюме.
Аналитика продукта: A/B-тесты, funnel.
Что HH ценит в DS
- Ranking опыт. Core для HH.
- NLP базовый. Texts — основной тип данных.
- A/B-тесты. Дизайн + analyse.
- Production ML. Не notebook-only.
- Engineering culture. Code review, тесты.
Как готовиться: план
За 4-6 недель:
- Неделя 1-2 — ML теория + Ranking + NLP. ML-теория, NLP.
- Неделя 3 — Python + SQL. Python для DS.
- Неделя 4 — System design. Two-sided marketplace кейсы. ML system design.
- Неделя 5 — A/B + production. A/B-тесты для DS.
- Неделя 6 — Mocks + behavioral.
Частые ошибки
- Без ranking опыта. HH core.
- Без NLP. Тексты — основной тип данных.
- Без A/B понимания. Спросят дизайн.
- «У меня deep learning». Pragmatism: LightGBM + features часто beats.
- Без production. Только эксперименты — спросят deployment.
Связанные темы
- Собеседование на Data Scientist
- ML-теория на собесе DS
- NLP задачи на собесе DS
- ML system design
- Feature engineering
- A/B-тесты для DS
FAQ
Удалёнка в HH для DS?
Гибрид часто.
Зарплатные вилки 2026?
Middle DS: 240-360k. Senior: 360-540k.
Английский нужен?
Базовый — желательно.
Сколько этапов?
4-5 этапов, 2-3 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.