Собеседование на Data Scientist в Яндекс Практикуме

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Яндекс Практикум — особенный работодатель для DS

Яндекс Практикум — EdTech-сервис в составе Яндекса: длинные программы переподготовки в IT, аналитике, дизайне, продакт-менеджменте и других направлениях. Целевая аудитория — взрослые специалисты, меняющие профессию. По размеру — один из крупнейших RU EdTech, по бренду — премиум-сегмент. Для Data Scientist это редкий микс: «крутость» Яндекса с инструментами и культурой плюс EdTech-специфика с длинным циклом и low-frequency покупками. Бонус — доступ к Яндекс-инфраструктуре (YT/YTSaurus, ClickHouse, MLflow-аналоги, A/B-фреймворк Adamage) и интеграция с экосистемой Яндекса для маркетинга и привлечения.

ML-домены: LTV-прогноз и lead-scoring, прогноз ROI рекламных каналов и MMM, attribution-моделирование, retention внутри программы обучения, прогноз career outcomes выпускников, recommendation смежных программ и upsell, NLP на отзывах, оптимизация маркетинговых кампаний внутри экосистемы Яндекса. Стек: Python, CatBoost, PyTorch для NLP-задач, YT (YTSaurus) для DWH и pipeline-ов, ClickHouse для аналитики, Nirvana для оркестрации, внутренний A/B-фреймворк Яндекса, MLflow-аналоги.

Актуальные вакансии — на Яндекс Карьере и hh.ru.

Информация основана на публичных источниках и опыте кандидатов. Команды Яндекс Практикума используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

Цикл 4–6 недель и включает 5–7 этапов. Процесс ближе к классическому Яндекс-стилю: алгоритмическая секция отдельным этапом, ML-теория глубокая, ML system design на конкретных кейсах.

1. HR-скрининг (30–45 минут)

Рекрутер проверяет: production-опыт DS (1.5+ года), английский, причины смены работы, ожидания. Опыт в EdTech, маркетинг-аналитике или подписочных продуктах — плюс. Питч 60–90 секунд.

2. Алгоритмическая секция (60–90 минут)

Та самая яндекс-секция: 2–3 задачи LeetCode уровня Medium-Hard на алгоритмы и структуры данных. Деревья, графы, динамика, хешмапы — стандартный набор. Готовиться: минимум 100 задач за 4–6 недель.

Подготовка: Live-coding.

3. ML / DS-теория (60–90 минут)

С senior DS из команды. Темы: классика (бустинги — особенно CatBoost, регуляризация, метрики, calibration), uplift-моделирование, survival анализ, причинно-следственный анализ (CATE, DR-learners), статистика (статтесты, ratio-метрики, delta-method, sequential testing). Готовься выводить формулы и объяснять trade-off на конкретных EdTech-кейсах.

Подготовка: Классическая ML на собесе, Метрики модели.

4. Python + SQL live-coding (60–90 минут)

Live: 1 задача LeetCode Medium, 2–3 на pandas / SQL по учебным данным. SQL в Яндексе обычно классический YT-стиль: оконные функции, complex JOINs, retention-формулы. Готовиться: оконки, EXPLAIN, partition pruning.

Подготовка: SQL-собес.

5. A/B и эксперименты (60 минут)

Отдельная глубокая секция: дизайн эксперимента, sample size, MDE, ratio-метрики, delta-method, peeking и sequential testing, CUPED, SRM, multiple testing, как анализировать долгосрочный эффект на коротком тесте при LTV-горизонте 6–12 мес. Готовь конкретные кейсы из работы с цифрами.

Подготовка: A/B и causal inference.

6. ML system design (90 минут)

Самая длинная секция. Кейсы: «спроектируй lead-scoring для Я.Практикума», «как ты бы построил LTV-модель для нового направления», «придумай рекомендатель смежных программ». От тебя ждут структурированный ответ: формулировка метрики и target, описание данных, baseline, итерации, A/B-план, мониторинг. Сильные кандидаты обсуждают cost / value и риски.

Подготовка: ML system design.

7. Поведенческое + культурный fit (45 минут)

С тимлидом и/или продактом. STAR-формат. Проверяют Yandex Values — ownership, фокус на пользе пользователю, готовность копать вглубь. Часть секции может быть на английском.

Особенности по командам

Marketing & Acquisition. Главная команда: оптимизация рекламных кампаний (с учётом всей экосистемы Яндекса), attribution, lead-scoring, прогноз ROI. Уникальная возможность — использовать сигналы из других продуктов Яндекса для оптимизации (с учётом data governance). Подойдёт DS с background в performance-маркетинге или banking-scoring.

Conversion & Funnel ML. Прогноз конверсии лидов на каждом шаге воронки: показ → клик → лендинг → консультация → оплата. Тесная связка с продуктовой командой лендингов и flow покупки.

Retention & Student Success. Прогноз выпадения студента, оптимизация интервенций менторов и кураторов, реактивация спящих. Длинные программы (4–12 мес) делают эту задачу важнее, чем в casual-EdTech.

Career Outcomes. Уникальная для премиум-EdTech команда: трекинг трудоустройства выпускников, прогноз career outcomes для лидов с разным бэкграундом, кейсы для маркетинга и переговоров с партнёрами-работодателями.

Cross-Yandex Product DS. Использование сигналов из экосистемы Яндекса (с поправкой на data governance и согласия пользователей): какие сегменты Я.Музыки / Я.Маркета чаще покупают курсы по аналитике, как использовать сигнал из Я.Браузера для UA. Тесная связка с data governance.

Educational Analytics. Меньше команда: метрики качества курсов, completion rate, NLP на отзывах и работах студентов.

Pricing & Cohort Economics. Команда вокруг ценообразования и unit-economics: оптимизация цены и рассрочки, прогноз ROI нового направления, A/B-эксперименты с тарифной сеткой. Тесная связка с финансами и продактами.

Mentor & Curator Analytics. Уникальная для Я.Практикума команда: анализ эффективности менторов и кураторов, прогноз нагрузки и подбор студентов под ментора. Внутри Яндекса это смесь HR-analytics и operational-DS.

Что Яндекс Практикум ценит в DS

Сильные фундаменты. Это Яндекс, фундаментальный уровень ML и алгоритмов выше среднего по рынку. Слабый ответ на алгоритмическую задачу — почти гарантированный отказ.

Production-опыт с цифрами. Weak: «обучил lead-scoring, AUC 0.81». Strong: «обучил lead-scoring CatBoost на 500k лидов, time-based валидация по неделям, calibration через isotonic, в A/B на 25% маркетинговых трафиков за 14 дней +14% качественных лидов и +9% к ROI; бизнес-эффект — около +X млн руб./мес. на одном направлении». Цифры обязательны.

Понимание EdTech-специфики. Длинный цикл (6–12 мес), high-ticket покупка, важность career outcomes для маркетинга. Кандидат, мыслящий категориями e-commerce, выглядит сыро.

A/B-зрелость. A/B-инфраструктура Яндекса (Adamage) одна из самых зрелых в РФ. Кандидат должен говорить про эксперименты на одном уровне с интервьюером: ratio-метрики, delta-method, sequential testing.

Английский. B2 минимум, для senior — C1. Часть документации и часть процессов могут быть на английском.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

Минимум 8–10 недель. Неделя 1–2: ML-теория (классика, бустинги, calibration, causal inference). Неделя 3–4: LeetCode Medium-Hard (100+ задач). Неделя 5: SQL — оконки, ClickHouse-стиль, complex JOINs. Неделя 6: A/B — теория, CUPED, sequential testing. Неделя 7: ML system design — отработай 5 кейсов (lead-scoring, LTV, retention, career outcomes, recsys). Неделя 8: подготовь STAR-истории, изучи Я.Практикум, прочитай 2–3 публичных кейса. Неделя 9–10: подтяни английский, mock-интервью.

Для тренировки реальных вопросов с DS-собесов — открывай Карьерник: 1500+ задач по SQL, Python, A/B, статистике, продуктовой аналитике и ML по темам и сложности.

Частые ошибки

Первая — слабая алгоритмическая подготовка. В Яндексе секция по алгоритмам — отдельный гейт, и без 80–100 решённых LeetCode Medium её не пройти.

Вторая — игнорирование long-horizon метрик. Я.Практикум живёт на LTV-12-месяцев и career outcomes. Кандидат, фокусирующийся только на конверсии в оплату — выпадает.

Третья — слабое объяснение A/B. Adamage — серьёзный инструмент, и кандидат, который не различает ratio-метрики, delta-method и sequential testing, выглядит сыро для middle+.

Четвёртая — попытка перенести подходы из e-commerce без EdTech-поправки. Long cycle, high-ticket, low-frequency — это не e-commerce.

Пятая — слабая работа с экосистемой Яндекса. Если ты на собесе игнорируешь возможности cross-product сигналов и data governance, теряешь сильное преимущество.

Связанные темы

FAQ

Сколько этапов в собесе DS в Яндекс Практикуме?

5–7 этапов: HR-скрининг, алгоритмическая секция, ML / DS-теория, Python + SQL live-coding, A/B-секция, ML system design, поведенческое. Цикл — 4–6 недель.

Чем DS в Я.Практикуме отличается от DS в Яндекс-Поиске?

По стеку и культуре — близко (общий Яндекс), но задачи другие: EdTech-DS работает с long-cycle, low-frequency продуктом, фокус на marketing-DS и retention. Поиск-DS работает с recsys / ranking в реальном времени.

Нужен ли опыт работы в Яндексе?

Не обязателен. Но опыт работы с большими A/B-инфраструктурами и сильные алгоритмические скиллы — must.

Какой английский нужен?

B2 минимум, для senior — C1. Часть документации и часть процессов могут быть на английском.

Сколько платят DS в Яндекс Практикуме?

Зависит от грейда. На уровне других Яндекс-команд: для middle DS — выше рынка, для senior — премиум. EdTech-команда обычно платит не ниже других Яндекс-направлений.

Что важнее на собесе — алгоритмы или ML system design?

В равной степени. Алгоритмическая секция — отдельный гейт; ML system design — отдельный. Без сильной подготовки к обеим секциям шансов мало. Дополнительно — A/B-секция, которая в Яндексе глубокая.

Berut ли DS без опыта в Яндексе или его экосистеме?

Берут, если есть сильный фундамент: алгоритмы, ML-теория, опыт production-моделей с A/B-валидацией и цифрами по бизнес-метрикам. Опыт в EdTech, маркетинг-аналитике или подписочных продуктах — сильный плюс.