Собеседование на Data Scientist в Яндекс Практикуме
Содержание:
Почему Яндекс Практикум — особенный работодатель для DS
Яндекс Практикум — EdTech-сервис в составе Яндекса: длинные программы переподготовки в IT, аналитике, дизайне, продакт-менеджменте и других направлениях. Целевая аудитория — взрослые специалисты, меняющие профессию. По размеру — один из крупнейших RU EdTech, по бренду — премиум-сегмент. Для Data Scientist это редкий микс: «крутость» Яндекса с инструментами и культурой плюс EdTech-специфика с длинным циклом и low-frequency покупками. Бонус — доступ к Яндекс-инфраструктуре (YT/YTSaurus, ClickHouse, MLflow-аналоги, A/B-фреймворк Adamage) и интеграция с экосистемой Яндекса для маркетинга и привлечения.
ML-домены: LTV-прогноз и lead-scoring, прогноз ROI рекламных каналов и MMM, attribution-моделирование, retention внутри программы обучения, прогноз career outcomes выпускников, recommendation смежных программ и upsell, NLP на отзывах, оптимизация маркетинговых кампаний внутри экосистемы Яндекса. Стек: Python, CatBoost, PyTorch для NLP-задач, YT (YTSaurus) для DWH и pipeline-ов, ClickHouse для аналитики, Nirvana для оркестрации, внутренний A/B-фреймворк Яндекса, MLflow-аналоги.
Актуальные вакансии — на Яндекс Карьере и hh.ru.
Информация основана на публичных источниках и опыте кандидатов. Команды Яндекс Практикума используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл 4–6 недель и включает 5–7 этапов. Процесс ближе к классическому Яндекс-стилю: алгоритмическая секция отдельным этапом, ML-теория глубокая, ML system design на конкретных кейсах.
1. HR-скрининг (30–45 минут)
Рекрутер проверяет: production-опыт DS (1.5+ года), английский, причины смены работы, ожидания. Опыт в EdTech, маркетинг-аналитике или подписочных продуктах — плюс. Питч 60–90 секунд.
2. Алгоритмическая секция (60–90 минут)
Та самая яндекс-секция: 2–3 задачи LeetCode уровня Medium-Hard на алгоритмы и структуры данных. Деревья, графы, динамика, хешмапы — стандартный набор. Готовиться: минимум 100 задач за 4–6 недель.
Подготовка: Live-coding.
3. ML / DS-теория (60–90 минут)
С senior DS из команды. Темы: классика (бустинги — особенно CatBoost, регуляризация, метрики, calibration), uplift-моделирование, survival анализ, причинно-следственный анализ (CATE, DR-learners), статистика (статтесты, ratio-метрики, delta-method, sequential testing). Готовься выводить формулы и объяснять trade-off на конкретных EdTech-кейсах.
Подготовка: Классическая ML на собесе, Метрики модели.
4. Python + SQL live-coding (60–90 минут)
Live: 1 задача LeetCode Medium, 2–3 на pandas / SQL по учебным данным. SQL в Яндексе обычно классический YT-стиль: оконные функции, complex JOINs, retention-формулы. Готовиться: оконки, EXPLAIN, partition pruning.
Подготовка: SQL-собес.
5. A/B и эксперименты (60 минут)
Отдельная глубокая секция: дизайн эксперимента, sample size, MDE, ratio-метрики, delta-method, peeking и sequential testing, CUPED, SRM, multiple testing, как анализировать долгосрочный эффект на коротком тесте при LTV-горизонте 6–12 мес. Готовь конкретные кейсы из работы с цифрами.
Подготовка: A/B и causal inference.
6. ML system design (90 минут)
Самая длинная секция. Кейсы: «спроектируй lead-scoring для Я.Практикума», «как ты бы построил LTV-модель для нового направления», «придумай рекомендатель смежных программ». От тебя ждут структурированный ответ: формулировка метрики и target, описание данных, baseline, итерации, A/B-план, мониторинг. Сильные кандидаты обсуждают cost / value и риски.
Подготовка: ML system design.
7. Поведенческое + культурный fit (45 минут)
С тимлидом и/или продактом. STAR-формат. Проверяют Yandex Values — ownership, фокус на пользе пользователю, готовность копать вглубь. Часть секции может быть на английском.
Особенности по командам
Marketing & Acquisition. Главная команда: оптимизация рекламных кампаний (с учётом всей экосистемы Яндекса), attribution, lead-scoring, прогноз ROI. Уникальная возможность — использовать сигналы из других продуктов Яндекса для оптимизации (с учётом data governance). Подойдёт DS с background в performance-маркетинге или banking-scoring.
Conversion & Funnel ML. Прогноз конверсии лидов на каждом шаге воронки: показ → клик → лендинг → консультация → оплата. Тесная связка с продуктовой командой лендингов и flow покупки.
Retention & Student Success. Прогноз выпадения студента, оптимизация интервенций менторов и кураторов, реактивация спящих. Длинные программы (4–12 мес) делают эту задачу важнее, чем в casual-EdTech.
Career Outcomes. Уникальная для премиум-EdTech команда: трекинг трудоустройства выпускников, прогноз career outcomes для лидов с разным бэкграундом, кейсы для маркетинга и переговоров с партнёрами-работодателями.
Cross-Yandex Product DS. Использование сигналов из экосистемы Яндекса (с поправкой на data governance и согласия пользователей): какие сегменты Я.Музыки / Я.Маркета чаще покупают курсы по аналитике, как использовать сигнал из Я.Браузера для UA. Тесная связка с data governance.
Educational Analytics. Меньше команда: метрики качества курсов, completion rate, NLP на отзывах и работах студентов.
Pricing & Cohort Economics. Команда вокруг ценообразования и unit-economics: оптимизация цены и рассрочки, прогноз ROI нового направления, A/B-эксперименты с тарифной сеткой. Тесная связка с финансами и продактами.
Mentor & Curator Analytics. Уникальная для Я.Практикума команда: анализ эффективности менторов и кураторов, прогноз нагрузки и подбор студентов под ментора. Внутри Яндекса это смесь HR-analytics и operational-DS.
Что Яндекс Практикум ценит в DS
Сильные фундаменты. Это Яндекс, фундаментальный уровень ML и алгоритмов выше среднего по рынку. Слабый ответ на алгоритмическую задачу — почти гарантированный отказ.
Production-опыт с цифрами. Weak: «обучил lead-scoring, AUC 0.81». Strong: «обучил lead-scoring CatBoost на 500k лидов, time-based валидация по неделям, calibration через isotonic, в A/B на 25% маркетинговых трафиков за 14 дней +14% качественных лидов и +9% к ROI; бизнес-эффект — около +X млн руб./мес. на одном направлении». Цифры обязательны.
Понимание EdTech-специфики. Длинный цикл (6–12 мес), high-ticket покупка, важность career outcomes для маркетинга. Кандидат, мыслящий категориями e-commerce, выглядит сыро.
A/B-зрелость. A/B-инфраструктура Яндекса (Adamage) одна из самых зрелых в РФ. Кандидат должен говорить про эксперименты на одном уровне с интервьюером: ratio-метрики, delta-method, sequential testing.
Английский. B2 минимум, для senior — C1. Часть документации и часть процессов могут быть на английском.
Как готовиться: план
Минимум 8–10 недель. Неделя 1–2: ML-теория (классика, бустинги, calibration, causal inference). Неделя 3–4: LeetCode Medium-Hard (100+ задач). Неделя 5: SQL — оконки, ClickHouse-стиль, complex JOINs. Неделя 6: A/B — теория, CUPED, sequential testing. Неделя 7: ML system design — отработай 5 кейсов (lead-scoring, LTV, retention, career outcomes, recsys). Неделя 8: подготовь STAR-истории, изучи Я.Практикум, прочитай 2–3 публичных кейса. Неделя 9–10: подтяни английский, mock-интервью.
Для тренировки реальных вопросов с DS-собесов — открывай Карьерник: 1500+ задач по SQL, Python, A/B, статистике, продуктовой аналитике и ML по темам и сложности.
Частые ошибки
Первая — слабая алгоритмическая подготовка. В Яндексе секция по алгоритмам — отдельный гейт, и без 80–100 решённых LeetCode Medium её не пройти.
Вторая — игнорирование long-horizon метрик. Я.Практикум живёт на LTV-12-месяцев и career outcomes. Кандидат, фокусирующийся только на конверсии в оплату — выпадает.
Третья — слабое объяснение A/B. Adamage — серьёзный инструмент, и кандидат, который не различает ratio-метрики, delta-method и sequential testing, выглядит сыро для middle+.
Четвёртая — попытка перенести подходы из e-commerce без EdTech-поправки. Long cycle, high-ticket, low-frequency — это не e-commerce.
Пятая — слабая работа с экосистемой Яндекса. Если ты на собесе игнорируешь возможности cross-product сигналов и data governance, теряешь сильное преимущество.
Связанные темы
- Собеседование на Data Scientist в Яндексе
- Собеседование на Data Scientist в Нетологии
- Собеседование на Data Scientist в Skillbox
- Собеседование на Data Scientist — гайд
FAQ
Сколько этапов в собесе DS в Яндекс Практикуме?
5–7 этапов: HR-скрининг, алгоритмическая секция, ML / DS-теория, Python + SQL live-coding, A/B-секция, ML system design, поведенческое. Цикл — 4–6 недель.
Чем DS в Я.Практикуме отличается от DS в Яндекс-Поиске?
По стеку и культуре — близко (общий Яндекс), но задачи другие: EdTech-DS работает с long-cycle, low-frequency продуктом, фокус на marketing-DS и retention. Поиск-DS работает с recsys / ranking в реальном времени.
Нужен ли опыт работы в Яндексе?
Не обязателен. Но опыт работы с большими A/B-инфраструктурами и сильные алгоритмические скиллы — must.
Какой английский нужен?
B2 минимум, для senior — C1. Часть документации и часть процессов могут быть на английском.
Сколько платят DS в Яндекс Практикуме?
Зависит от грейда. На уровне других Яндекс-команд: для middle DS — выше рынка, для senior — премиум. EdTech-команда обычно платит не ниже других Яндекс-направлений.
Что важнее на собесе — алгоритмы или ML system design?
В равной степени. Алгоритмическая секция — отдельный гейт; ML system design — отдельный. Без сильной подготовки к обеим секциям шансов мало. Дополнительно — A/B-секция, которая в Яндексе глубокая.
Berut ли DS без опыта в Яндексе или его экосистеме?
Берут, если есть сильный фундамент: алгоритмы, ML-теория, опыт production-моделей с A/B-валидацией и цифрами по бизнес-метрикам. Опыт в EdTech, маркетинг-аналитике или подписочных продуктах — сильный плюс.