Собеседование на Data Scientist в Yandex Cloud
Содержание:
Почему Yandex Cloud — особенный работодатель для DS
Yandex Cloud — облачное подразделение Яндекса: IaaS, PaaS, managed-сервисы баз данных и Kubernetes, ML-платформа DataSphere, AI-сервисы (Yandex SpeechKit, Translate, Vision, foundation-модели семейства YandexGPT), Yandex Tracker и другие managed-продукты. Один из топ-3 публичных российских облачных провайдеров. Для DS это очень своеобразное место: формально облако, но фактически — часть огромной экосистемы Яндекса со всеми вытекающими (Яндекс-стек, Яндекс-процессы, Яндекс-планка по алгоритмам).
Главные ML-домены: прогноз нагрузки на ЦОДы и GPU-кластеры, anomaly detection на инфраструктуре, predictive maintenance, ML-сервисы как продукт (SpeechKit, Vision, Translate, YandexGPT inference), churn и upsell enterprise-клиентов, антифрод на регистрациях и тарификации, иногда — интеграции с recsys и поиском Яндекса для клиентов, мигрировавших в облако. Часть моделей — для внешних клиентов через API, часть — для внутренней оптимизации, часть — для R&D в рамках Yandex AI Foundation.
Стек: Python + PyTorch + Catboost + YT (YTSaurus, OS-flavor доступен для клиентов как managed-сервис) + ClickHouse + Yandex MapReduce; внутренние Яндекс-инструменты для трекинга экспериментов (Nirvana, Tracker, MLflow flavor); Kubernetes; для AI-сервисов — Triton, TensorRT, кастомные C++ inference-сервера. Большая часть процессов и регламентов взята из основного Яндекса — пайплайн собеседования это отражает.
Актуальные вакансии — на hh.ru и сайте Яндекса.
Информация основана на публичных источниках и опыте кандидатов. Команды Yandex Cloud используют разные процессы — формат зависит от направления и грейда, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 4-6 недель, 5-7 этапов. Процесс — типичный «Яндекс-style»: жёсткая алгоритмическая секция отдельно, ML-секция отдельно, ML System Design с продуктовым кейсом, поведенческое, финал. Если идёшь на роль, связанную с инфраструктурой или GPU-кластерами, добавляется отдельная техническая секция по производительности и инференсу. Compliance-этапа в открытом виде нет, но для определённых клиентов есть NDA-проверки.
1. HR-скрининг (30-45 минут)
Рекрутер уточняет: production-опыт ML (минимум 1-2 года, желательно с моделью в проде на серьёзном трафике), есть ли опыт в AI-сервисах, облаках или других крупных компаниях, мотивацию идти именно в Yandex Cloud, ожидания по компенсации, готовность к гибридному графику. У Яндекса своя жёсткая планка по алгоритмам — на скрининге об этом предупредят. Готовь питч на 90 секунд про самый зрелый production-кейс с цифрами.
2. ML-теория (60-90 минут)
Базовая секция со старшим DS из команды. Темы: градиентный бустинг (особенно Catboost — это Яндекс, его придумали; ordered boosting, обработка категориальных, регуляризация), классические методы (логистическая регрессия, регуляризация, метрики классификации), feature engineering, time-series (Prophet, лаги, валидация для рядов, anti-leakage), методы детекции аномалий (IF, autoencoders), embeddings (Word2Vec, item2vec, графовые), базовый DL (CNN, RNN, attention, transformer), если идёшь в AI-сервисы — обязательно глубокий блок про LLM (токенизация, attention, fine-tuning, PEFT/LoRA, RAG, prompt engineering, eval-стратегии). Спрашивают глубоко: «как бы ты валидировал time-series модель, если данные коррелированы по времени и пространству».
Подготовка: классическая ML, time series, deep learning.
3. Python live coding + алгоритмы (60-90 минут)
Та самая «Яндекс-секция»: 2-3 задачи уровня LeetCode Medium–Hard на алгоритмы и структуры данных в живом кодинге. Деревья (BST, treaps), графы (DFS/BFS, кратчайшие пути, mst), динамика, hash, two pointers, sliding window. После — задача на ML-pipeline или работу с данными в pandas. Готовиться по LeetCode и Codeforces Div 2 A-C минимум 100 решённых задач за 4-6 недель. Это самый частый отказ в Yandex Cloud — слабая алгоритмическая подготовка.
Подготовка: live coding.
4. ML System Design (90 минут)
Самая сложная и характерная секция. Кейс продуктовый: «спроектируй ASR-сервис под клиентов с разным акцентом», «как ты бы построил автоматический скейлинг GPU-кластера под LLM-инференс с разным размером моделей», «как сделать продукт fine-tuning-as-a-service на DataSphere», «как ты бы построил систему рекомендаций ML-сервисов клиентам Yandex Cloud». Нужно: уточнить бизнес-метрику и target, описать архитектуру (retrieval → ranking, инференс-pipeline), выбрать модели и обосновать, продумать фичи и данные, обсудить cost (GPU-час дорогой) и latency, A/B-план, мониторинг и деградации, train-serving skew. Слабые ответы — где кандидат сразу прыгает в «возьмём YandexGPT»; сильные — где видно понимание trade-off, опыт production-проблем и обсуждение costs.
Подготовка: ML system design, model serving.
5. Production / scale (60 минут, опционально)
Для команд, связанных с AI-сервисами и инференсом: вопросы про latency-оптимизацию (квантизация, distillation, batching, TensorRT), про работу с GPU-кластерами и K8s, про мониторинг drift, про инциденты с деградировавшей моделью. Кейсы с цифрами и реальными ситуациями. Не везде — но если идёшь в AI Services, готовься.
Подготовка: monitoring drift, feature stores.
6. Поведенческое + культурный fit (45 минут)
С тимлидом и/или представителем команды. STAR-формат: расскажи про конфликт с продактом, про факап с моделью в проде, про спор по архитектуре. Параллельно проверяют соответствие Yandex Values — ownership, фокус на пользе пользователю, готовность копать вглубь, готовность ошибаться и учиться. Не выдумывай: если факапов в прод не было, рассказывай про учебный pet-project, но честно.
7. Финал с руководителем (30 минут)
Финальная встреча: грейд, оффер, иногда финальные сомнения. Не отсев, но возможны корректировки по цифрам и грейду.
Особенности по командам
ML Platform / DataSphere. Команда строит ML-платформу для клиентов: Jupyter-ноутбуки, AutoML, model serving, эксперимент-трекинг, fine-tuning-as-a-service. DS здесь работает на стыке с инженерами и продактами: проектирует ML-фичи продукта. Стек — Python + PyTorch + Catboost + DataSphere как платформа. Челлендж — продукт для DS-аудитории, нужно понимать боли коллег. Подойдёт кандидатам, которые любят инструменты и MLOps.
AI Services (SpeechKit, Vision, Translate, YandexGPT inference). Команда делает AI-API: ASR, OCR, translation, image recognition, LLM-инференс. Тесно работает с Yandex AI Foundation. Челленджи — latency-оптимизация (квантизация, batching, TensorRT), стабильность под пиками, costing per request. Стек — PyTorch + Triton + TensorRT + кастомные inference-сервера. Подойдёт DS с CV/NLP-фоном и любовью к производительности.
Capacity и infrastructure DS. Классическая «облачная DS»: прогноз нагрузки на ЦОДы и GPU-пулы, anomaly detection на телеметрии, predictive maintenance. Стек — Python + Prophet + Catboost + YT + ClickHouse. Подойдёт кандидатам с background в supply-chain, telco, индустриальной аналитике.
B2B-аналитика и customer DS. Команда занимается прогнозом ухода крупных клиентов, кросс-сейлом сервисов, оценкой LTV, прогнозом revenue по аккаунту. Стек — Catboost + Greenplum + дашборды + SQL. Челлендж — маленькая выборка enterprise-клиентов, интерпретируемые фичи. Подойдёт DS с опытом B2B-аналитики или банковского сегментирования.
AI R&D (через Yandex AI Foundation). Часть проектов R&D-формата — обучение foundation-моделей, исследования по LLM, multimodal. Сюда переходят senior DS с фундаментальной подготовкой. Челленджи — GPU-кластеры, distributed training, серьёзная оптимизация моделей. Подойдёт кандидатам с PhD-уровнем или сильным DL-pet-проектом.
Что Yandex Cloud ценит в DS
Алгоритмы — Яндекс-уровень. Без серьёзной алгоритмической подготовки скорее всего отвалишься на code-секции — самый частый отсев. Стандарт — LeetCode Medium стабильно решаешь за 25 минут, Hard разбираешь хотя бы 30% задач. Олимпиадный бэкграунд — большой плюс, особенно в AI Services и платформе.
Production-опыт. История про модель в проде с количественным эффектом. «Сделал классификатор на Kaggle» — не история. «Запустил OCR-сервис на 5М запросов в день, +0.8% precision, минус 15% ручной модерации» — это история.
Понимание стоимости. GPU-час дорогой, и DS, который этого не учитывает, выглядит зелёным. На System Design ожидают обсуждения cost-per-prediction, GPU-utilization, batching. Если в ответе нет ни одного слова про деньги — балл проседает.
Универсальность плюс глубина в одной области. В Yandex Cloud ценят DS, который может в табличку и DL, но при этом глубже среднего в одной из областей (NLP, CV, time-series, RL). Это видно на ML-теории — «знаю всё чуть-чуть» рассматривается слабее, чем «знаю всё чуть-чуть, плюс глубоко в NLP с pet-project».
Weak vs strong на System Design. Слабый ответ: «возьмём fine-tune YandexGPT для классификации жалоб клиентов на тарифы». Сильный ответ: «начну с Catboost на эмбеддингах из small-модели — это в 100 раз дешевле в инференсе. Fine-tune YandexGPT — только если на наших данных Catboost не пробьёт baseline, и при этом я заложу мониторинг GPU-utilization, costing per ticket, автоматический rollback на дешёвую модель, если LLM-сервис деградирует».
Готовность к Яндекс-процессам. Согласования, релиз-окна, security-проверки, ревью кода в Arcanum. Кандидаты, которые ругают на собесе процессы, получают -1. Если процессы тебя пугают — лучше идти в Selectel.
Как готовиться: план
За 8-10 недель до планируемого собеса:
- Неделя 1-2 — Алгоритмы. LeetCode Medium 30+ задач, Codeforces Div 2 A-C 50+ задач. Деревья, графы, динамика, hash map, two pointers, sliding window. Не растягивай — самая критичная часть, основная масса в первые 2 недели.
- Неделя 3-4 — ML-теория и DL. Catboost (категориальные фичи, ordered boosting), classification metrics, time-series (Prophet, валидация), DL базы (PyTorch, transfer learning, fine-tuning, transformer architecture). Параллельно закрывай пробелы по теории на Карьернике: 1500+ задач по SQL, Python, статистике и ML, по 15-20 минут в день, чтобы за месяц закрыть базу и приходить на собес без «забыл, что такое L1 vs L2 регуляризация».
- Неделя 5 — Big data и Yandex-стек. Базовое понимание YT, Hive, Spark, K8s. Touch на DataSphere если можешь — формирует словарь.
- Неделя 6 — MLOps + feature stores. Как устроены feature stores, train-serving skew, как ловят и предотвращают. MLOps, Feature stores.
- Неделя 7 — ML System Design. Прорешай 5-7 кейсов: ASR-сервис, churn enterprise, anomaly на телеметрии, fine-tuning-as-a-service, OCR. Структура — бизнес → метрики → данные → архитектура → trade-off → A/B → monitoring → costing. ML system design.
- Неделя 8 — Production / inference. Drift detection, online/offline metrics divergence, canary deploys, A/B-инфраструктура, квантизация/distillation как методы ускорения. Monitoring drift, Model serving.
- Неделя 9-10 — Mocks + behavioral. Mock-интервью с друзьями. Готовь behavioral-истории: 5-7 кейсов с конфликтами, факапами, успехами по STAR.
Частые ошибки
Слабая алгоритмическая подготовка. Самый частый отказ — на code-секции. Кандидат с 5+ лет опыта в DS может не пройти задачи, которые студент 3 курса решает. Не пренебрегай.
Хайпуют LLM на любых задачах. Кандидат предлагает YandexGPT для классификации с 5000 примерами. Не понимает, что простой Catboost разнесёт LLM в пух. На System Design это сразу видно, балл проседает.
Не думают про costs. GPU-час дорогой. На System Design кандидат проектирует решение из 5 миллиардов параметров, не обсуждая, во сколько это обойдётся. Красный флаг для Yandex Cloud.
Не разбираются в инфраструктуре. «Я DS, я в Kubernetes не лезу» — нерабочая позиция в облачном провайдере. Базовое понимание K8s и DataSphere до собеса обязательно.
Не задают вопросы про данные. На кейсе сразу — модель, а не «какие данные есть, какая частота, какие пропуски, как мы их собираем». Первый фильтр.
Связанные темы
- Собеседование на Data Scientist
- Live coding на собесе DS
- ML system design
- Собеседование на ML Engineer в Yandex Cloud
- Собеседование на Data Scientist в Яндексе
FAQ
Удалёнка в Yandex Cloud для DS?
Чаще гибрид с офисом в Москве (БЦ «Красная Роза», «Аврора») или Санкт-Петербурге. Полная удалёнка возможна для senior+ при согласовании с тимлидом, но это не правило.
Зарплатные вилки 2026?
Middle DS: 300-460k. Senior: 460-720k. Staff/Lead — выше. Опционы/RSU в Яндексе сейчас не для всех (ситуация подвижная), уточняй у рекрутера.
Нужен ли английский?
Базовый — желательно (читать статьи, документацию). Свободный говорящий не обязателен для большинства команд, но для R&D и коллабораций с международными проектами — плюс.
Сколько этапов?
5-7 этапов, 4-6 недель от первого скрининга до оффера. Если процесс затягивается до 2 месяцев — это нормально, согласований много.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — команды могут менять процесс.