Собеседование на Data Scientist в Яндекс Маркет
Содержание:
Почему Яндекс Маркет — особенный работодатель для DS
Яндекс Маркет — крупнейший российский e-commerce-маркетплейс группы Яндекс: десятки миллионов активных пользователей в месяц, сотни тысяч продавцов, миллионы SKU, интеграция с Яндекс Плюсом, доставкой Яндекс Go и логистикой группы. Для Data Scientist это специфическое место: формально маркетплейс с типовыми задачами e-com (ранжирование, рекомендации, антифрод), но фактически — часть огромной экосистемы Яндекса со всеми вытекающими (Яндекс-стек, Яндекс-процессы, Яндекс-планка по алгоритмам).
Главные ML-домены: ранжирование выдачи и поиска по каталогу (точка отказа в e-com — кто-то не нашёл нужный товар, значит deal lost), рекомендательные системы (карточка товара «с этим покупают», главная страница, повторные покупки), антифрод продавцов и покупателей (фейковые отзывы, накрутки рейтингов, мошеннические транзакции), прогноз спроса на стороне продавцов (рекомендации, сколько закупать, чтобы не ушло в out-of-stock), персонализация в Яндекс Плюс, ассортиментная аналитика для продавцов, ценообразование (динамические подсказки продавцам). NLP для категоризации товаров, обработки отзывов, поисковых запросов. CV для классификации товарных фото.
Стек: Python + Catboost (изобретён в Яндексе, используется везде) + PyTorch + YT (YTSaurus) — основной DWH/processing-движок Яндекса; ClickHouse для аналитики; Nirvana для пайплайнов; MLflow flavor и внутренние Яндекс-инструменты для экспериментов; Kubernetes для serving. Часть критичной инфраструктуры — на C++ (особенно low-latency serving для ранжирования).
Актуальные вакансии — на hh.ru и сайте Яндекса.
Информация основана на публичных источниках и опыте кандидатов. Команды Яндекс Маркета используют разные процессы — формат зависит от направления, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 4-6 недель, 5-7 этапов. Процесс — типичный «Яндекс-style»: жёсткая алгоритмическая секция отдельно, ML-секция отдельно, ML System Design с продуктовым кейсом, поведенческое, финал. Из-за специфики e-commerce есть отдельный продуктовый блок про user behavior и метрики маркетплейса.
1. HR-скрининг (30-45 минут)
Рекрутер уточняет: production-опыт ML (минимум 1-2 года, желательно с моделью в проде на серьёзном трафике), есть ли опыт в e-com, маркетплейсах или recsys, мотивацию идти именно в Яндекс Маркет, ожидания по компенсации, готовность к гибридному графику. У Яндекса своя жёсткая планка по алгоритмам — на скрининге об этом предупредят. Готовь питч на 90 секунд про самый зрелый production-кейс с цифрами.
2. ML-теория (60-90 минут)
Базовая секция со старшим DS из команды. Темы: градиентный бустинг (особенно Catboost — это Яндекс, обязательно глубоко: ordered boosting, обработка категориальных, регуляризация, эмбеддинги категориальных), классические recsys-методы (CF, ALS, matrix factorization, факторизационные машины), двухбашенные нейросети для retrieval, ranking (pointwise/pairwise/listwise, NDCG, MAP, MRR), эмбеддинги (Word2Vec, item2vec, графовые), время и cold start (новые SKU, новые продавцы), DL-базовые (transformer для текста и для последовательностей кликов). Спрашивают глубоко: «как ты валидировал бы рекомендатель, если данные коррелированы по сессиям пользователей».
Подготовка: классическая ML, метрики модели, feature engineering.
3. Python live coding + алгоритмы (60-90 минут)
Та самая «Яндекс-секция»: 2-3 задачи уровня LeetCode Medium–Hard на алгоритмы и структуры данных в живом кодинге. Деревья (BST, treaps, segment trees), графы (DFS/BFS, кратчайшие пути), динамика, hash, two pointers, sliding window, sorting/selection. После — задача на ML-pipeline или работу с данными: написать функцию для расчёта NDCG, отладить чужой код с утечкой train/test. Готовиться по LeetCode и Codeforces Div 2 A-C минимум 100 решённых задач за 4-6 недель. Самый частый отказ в Яндекс Маркете — слабая алгоритмическая подготовка.
Подготовка: live coding.
4. ML System Design (90 минут)
Самая сложная и характерная секция. Кейс продуктовый: «спроектируй ранжирование на главной странице Маркета», «как ты бы построил систему рекомендаций „с этим покупают“», «как сделать антифрод для накрученных отзывов», «как оценить новый алгоритм ранжирования в A/B без сильного риска для GMV». Нужно: уточнить бизнес-метрику и target, описать архитектуру (retrieval → ranking → re-ranking), выбрать модели и обосновать, продумать фичи (offline и online), обсудить данные (взаимодействия, контент, контекст), A/B-план и edge-cases (новые товары/категории, длинный хвост), мониторинг и popularity bias, train-serving skew. Слабые ответы — где кандидат сразу прыгает в «возьмём transformer на последовательностях»; сильные — где видно понимание trade-off, опыт production-проблем (cold start, gaming-устойчивость, popularity bias).
Подготовка: ML system design, model serving.
5. Поведенческое + культурный fit (45 минут)
С тимлидом и/или представителем команды. STAR-формат: расскажи про конфликт с продактом, про факап с моделью в проде, про спор по архитектуре. Параллельно проверяют соответствие Yandex Values — ownership, фокус на пользе пользователю, готовность копать вглубь, готовность ошибаться. Не выдумывай: если факапов в прод не было, рассказывай про учебный pet-project, но честно.
6. Финал с руководителем (30 минут)
Финальная встреча: грейд, оффер, иногда финальные сомнения. Не отсев, но возможны корректировки.
Особенности по командам
Search & Ranking. Самая большая и центральная команда: ранжирование результатов поиска по каталогу, главная страница, категорийные витрины. Модели — двухбашенки для retrieval + Catboost/нейросети для ранжирования. Главные челленджи: cold start новых SKU и продавцов, баланс популярного и нового, gaming-устойчивость к продавцам, накручивающим рейтинги. Сюда часто берут DS с recsys-фоном в e-com или search-фоном в больших медиа.
Recommendations. Команда отвечает за блоки «с этим покупают», «продолжите выбор», персональные рекомендации в карточке, в письме, в Плюсе. Стек — двухбашенные сети + Catboost + кастомные feature stores. Челлендж — комплексные пути в e-com (клиент кликает, добавляет в корзину, покупает через неделю; что считать сигналом?), длинные хвосты SKU, репрезентативность. Подойдёт DS с серьёзным recsys-background.
Trust & Antifraud. Команда борется с фейковыми отзывами, накрутками рейтингов, мошенническими транзакциями. Стек — Catboost + графовые методы + autoencoders + Spark. Челлендж — adversarial-задачи (мошенники меняют тактику быстро), маленькая выборка подтверждённого фрода. Подойдёт DS с опытом в антифроде или security.
Seller Analytics и B2B-DS. Команда строит инструменты для продавцов: рекомендации по ассортименту, прогнозу спроса на стороне продавца, динамические подсказки по цене, предсказания out-of-stock. Стек — Catboost + Prophet + дашборды. Челлендж — продукт для B2B-сегмента (продавцы), нужно понимать их операционку. Подойдёт DS с опытом в B2B-аналитике или supply-chain.
NLP / категоризация. Команда занимается классификацией товаров, обработкой поисковых запросов, анализом отзывов и описаний. Стек — PyTorch + transformer-модели + YandexGPT-fine-tunes. Челлендж — миллионы новых SKU в месяц, длиннющие хвосты, многоязычность некоторых сегментов. Подойдёт DS с NLP-фоном и желанием возиться с большими каталогами.
Что Яндекс Маркет ценит в DS
Алгоритмы — Яндекс-уровень. Без серьёзной алгоритмической подготовки скорее всего отвалишься на code-секции — самый частый отсев. Стандарт — LeetCode Medium стабильно решаешь за 25 минут, Hard разбираешь хотя бы 30%. Олимпиадный бэкграунд — большой плюс, особенно в Search & Ranking.
Production ML на масштабе. История про модель в проде с количественным эффектом на бизнес-метрику. «Сделал модель на 3% лучше baseline на Kaggle» — не история. «Запустил ранжирование на 5М DAU, +1.4% CTR, +0.8% GMV в A/B на 4 недели, поборол degradation за 2 недели» — это история.
E-com / recsys context. Понимание особенностей маркетплейса, recsys-метрик в e-com (NDCG, CTR vs revenue, freshness, exposure fairness), знание trade-off (популярные vs новые товары, GMV vs UX). Если в e-com не работал — читай блог HM Tech, Amazon Engineering, Алибаба-статьи по ранжированию.
Универсальность плюс глубина. В Маркете ценят DS, который может в табличный ML и recsys, но при этом глубже среднего в одной из областей (ranking, embeddings, NLP, антифрод). На ML-теории это видно — «знаю всё чуть-чуть» рассматривается слабее, чем «знаю всё чуть-чуть, плюс глубоко в графовых recsys».
Weak vs strong на System Design. Слабый ответ: «возьмём огромный transformer для ранжирования, обучим end-to-end на всех взаимодействиях». Сильный ответ: «retrieval — двухбашенка с эмбеддингами, ranking — Catboost на 200 фичах. Для cold start новых SKU добавлю content-based path. Заложу мониторинг doли popularity bias и регулярный A/B на холдауте. Transformer end-to-end — только когда упрёмся в потолок Catboost, и при этом я заложу canary-rollout и kill-switch на старую модель, потому что в e-com обвал GMV из-за модели — деньги».
Готовность к Яндекс-процессам. Согласования, code review в Arcanum, релиз-окна. Кандидаты, которые ругают процессы на собесе, получают -1.
Как готовиться: план
За 8-10 недель до планируемого собеса:
- Неделя 1-2 — Алгоритмы. LeetCode Medium 30+ задач, Codeforces Div 2 A-C 50+ задач. Деревья, графы, динамика, hash map, two pointers, sliding window. Не растягивай — самая критичная часть, основная масса в первые 2 недели.
- Неделя 3-4 — Recsys и Catboost. Catboost (категориальные фичи, ordered boosting), CF и matrix factorization, factorization machines, двухбашенные нейросети, ranking metrics (NDCG, MAP, MRR). Pet-project на recsys с публичным датасетом (MovieLens, H&M). Параллельно — на Карьернике закрой пробелы по SQL, Python и базе ML: 1500+ задач, по 15-20 минут в день, чтобы за месяц закрыть базу и не путаться в простых вопросах вроде «как валидировать ranking-модель».
- Неделя 5 — Big data и Yandex-стек. Базовое понимание YT, Hive, Spark, K8s. Если можешь — touch на DataSphere для формирования словаря.
- Неделя 6 — MLOps и serving. Как устроены feature stores, train-serving skew, A/B-инфраструктура, мониторинг drift. MLOps, Feature stores.
- Неделя 7 — ML System Design. Прорешай 5-7 кейсов: ранжирование главной, «с этим покупают», антифрод отзывов, prediction для продавцов, NLP-категоризация. Структура — бизнес → метрики → данные → архитектура → trade-off → A/B → monitoring. ML system design.
- Неделя 8 — Monitoring + deployment. Drift detection, canary deploys, A/B-инфраструктура. Monitoring drift, Model serving.
- Неделя 9-10 — Mocks + behavioral. Mock-интервью с друзьями. Готовь behavioral-истории: 5-7 кейсов с конфликтами, факапами, успехами по STAR.
Частые ошибки
Слабая алгоритмическая подготовка. Самый частый отказ — на code-секции. Кандидат с 5+ лет опыта в DS может не пройти задачи, которые студент 3 курса решает. Не пренебрегай.
Без e-com / recsys-контекста. На System Design сразу заметно, если ты не понимаешь специфику ранжирования в маркетплейсе. Прочитай хотя бы 3-5 статей: HM Tech, Amazon Engineering, статьи Алибабы. Знай отличие CTR-оптимизации от revenue-оптимизации.
Без production-историй. Кандидаты часто рассказывают про модели «в Jupyter», без деталей про prod. «У нас была система рекомендаций» — не история. «Поднял Catboost-recall в e-com на 1М DAU, +1.5% CTR в A/B, продакшен на K8s с canary на 5% трафика» — история.
Хайпуют transformer’ами. Кандидат предлагает sequential transformer для всего. На вопрос «а Catboost?» — ответа нет. В Маркете на табличке Catboost остаётся baseline.
Игнорируют popularity bias и cold start. В e-com 80% кликов идёт на топ-10% SKU. Если модель кандидата не учитывает это явно — балл проседает.
Связанные темы
- Собеседование на Data Scientist
- ML system design
- Метрики модели
- Собеседование на Data Scientist в Яндексе
- Собеседование на аналитика в Яндекс Маркет
FAQ
Удалёнка в Яндекс Маркете для DS?
Чаще гибрид с офисом в Москве (БЦ «Красная Роза», «Аврора») или Санкт-Петербурге. Полная удалёнка возможна для senior+ при согласовании с тимлидом, но это не правило.
Зарплатные вилки 2026?
Middle DS: 320-490k. Senior: 490-780k. Staff/Lead — выше. Опционы/RSU в Яндексе сейчас не для всех (ситуация подвижная), уточняй у рекрутера.
Английский нужен?
Базовый — желательно (читать статьи, документацию). Свободный говорящий не обязателен для большинства команд, но для R&D и коллабораций с международными проектами — плюс.
Сколько этапов?
5-7 этапов, 4-6 недель от первого скрининга до оффера. Если процесс затягивается до 2 месяцев — нормально, согласований много.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — команды могут менять процесс.