Собеседование на Data Scientist в Cloud.ru
Содержание:
Почему Cloud.ru — особенный работодатель для DS
Cloud.ru (ранее SberCloud) — облачное подразделение группы Сбер, второй-третий по размеру публичный облачный провайдер РФ: IaaS, PaaS, managed-сервисы баз данных, ML-платформа ML Space, AI-сервисы поверх инфраструктуры Сбера (включая GigaChat, Kandinsky и другие модели группы). Для DS это специфическое место: с одной стороны — много задач классического облака (capacity, anomaly, churn), с другой — много AI-вокруг-LLM (инференс на GPU-парке, оптимизация под latency, MLOps-фичи для клиентов).
Главные ML-домены: capacity-прогноз и оптимизация GPU-кластеров (одна из самых дорогих статей затрат), anomaly detection на облачной инфраструктуре, predictive maintenance, ML-сервисы поверх ML Space (готовые модели, fine-tuning, AutoML), AI-инференс под клиентов (Kandinsky, GigaChat, OCR, ASR как сервисы), churn и cross-sell на enterprise-сегменте, антифрод на регистрациях и платежах за облако. Часть моделей — для внутренних задач (как Selectel или Yandex Cloud), часть — продукт, который клиенты используют через API.
Стек: Python + PyTorch + Catboost + scikit-learn; ML Space как внутренняя платформа для экспериментов; ClickHouse и Greenplum для аналитики; Kubernetes; Airflow; внутренние Сбер-инструменты для трекинга экспериментов. Для AI-сервисов — TensorRT, Triton, кастомные inference-сервера на CUDA. Сбер-наследие чувствуется: процессы и регламенты ближе к Сберу, чем к стартапу.
Актуальные вакансии — на hh.ru и сайте Cloud.ru.
Информация основана на публичных источниках и опыте кандидатов. Команды Cloud.ru используют разные процессы — формат зависит от направления, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 4-6 недель, 5-6 этапов. Процесс ближе к Сберу, чем к мелким облачным провайдерам: больше согласований, больше документов на старте, отдельные этапы безопасности и compliance для определённых ролей. Если приходишь в команду, которая работает с государственными данными или GosCloud, — будет ещё SF-проверка.
1. HR-скрининг (30-45 минут)
Рекрутер уточняет: production-опыт ML (от 1.5-2 лет, с моделью в проде, не Kaggle-only), есть ли опыт с GPU-инфраструктурой или LLM-инференсом (плюс — но не обязательно), знание классического облачного стека, мотивацию идти именно в Cloud.ru, а не в Yandex Cloud или Selectel. Спросят про ожидания и про готовность к гибридному графику в Москве (офис на Кутузовском). Готовь питч на 90 секунд про самый зрелый production-кейс с цифрами.
2. ML-теория (60-90 минут)
Базовая секция с senior DS из целевой команды. Темы: градиентный бустинг (Catboost — почему он, что с категориальными фичами), классические методы (логистическая регрессия, метрики классификации, обработка дисбаланса классов через class_weight и oversampling), time-series для прогнозирования нагрузки, основы Deep Learning (где применяется DL и где не нужно), embeddings (для recsys и поиска), базовый блок про LLM (если идёшь в AI-сервисы — будет глубже: токенизация, attention, RAG, prompt-engineering, fine-tuning vs PEFT). Спрашивают именно базу: cold start, train-test leakage, как разделять данные с временной зависимостью.
Подготовка: классическая ML, метрики модели.
3. Python live coding + алгоритмы (60-90 минут)
Задачи на алгоритмы — уровня LeetCode Easy/Medium (1-2 шт.) плюс задача на работу с данными в pandas (1 шт.). Алгоритмический упор не такой жёсткий, как в Яндексе или Тинькофф, но базу проверяют чётко: хешмапы, два указателя, простая динамика, обход дерева. Pandas — фильтры, groupby, merge, оконные функции типа rank() через transform. Готовиться: 30-50 LeetCode Medium и 20 задач на pandas.
Подготовка: live coding.
4. ML System Design (90 минут)
Самая характерная секция. Кейс — продуктовый или инфраструктурный: «спроектируй систему мониторинга качества AI-сервиса, который мы продаём клиентам», «как ты бы построил автоматический скейлинг GPU-кластера под LLM-инференс», «как сделать продукт fine-tuning-as-a-service». Структура ответа: бизнес-метрика → данные → архитектура (retrieval, ranking, инференс) → выбор моделей → MLOps-пайплайн → A/B и мониторинг → costing. Сильный сигнал — обсуждение GPU-utilization и costs, потому что в Cloud.ru это часть оценки продукта.
Подготовка: ML system design, MLOps.
5. Поведенческое + culture fit (45-60 минут)
С тимлидом или представителем R&D-команды. STAR-формат: расскажи про конфликт с заказчиком, про факап с моделью в проде, про спор по архитектуре. Параллельно проверяют соответствие Сбер-ценностям (Cloud.ru их наследует): клиентоцентричность, ответственность за результат, готовность к процессам. Если ты пришёл из стартапа и тебе не нравятся согласования, лучше честно сказать на скрининге.
6. Финал с руководителем (30-45 минут)
Финальная встреча с руководителем направления. Обсуждают грейд, оффер, иногда финальные сомнения. Не отсев, но возможны корректировки по цифрам — Cloud.ru частично подчинён ценовой политике Сбера, выше потолка не прыгнет.
Особенности по командам
ML Platform / ML Space. Команда строит платформу для внутренних и внешних DS — Jupyter-ноутбуки, AutoML, model serving, эксперимент-трекинг. DS здесь работает на стыке с инженерами: проектирует ML-фичи продукта (например, AutoML-движок, который клиенты используют через интерфейс). Стек — Python + PyTorch + Catboost + ML Space как платформа. Челлендж — продукт для DS-аудитории, нужно понимать боли коллег по индустрии. Подойдёт кандидатам, которые любят инструменты и MLOps, а не только обучать модели.
AI Services. Команда делает AI-API поверх инфраструктуры Cloud.ru: speech-to-text, OCR, image processing, иногда — LLM-инференс под кастомные сценарии. Тесно работает с командами Сбер AI (Kandinsky, GigaChat). Челленджи — инференс-оптимизация (квантизация, batching, TensorRT), стабильность latency под пиковой нагрузкой, биллинг и rate-limiting. Стек — PyTorch + Triton + TensorRT + CUDA. Подойдёт DS с CV/NLP-фоном и любовью к производительности.
Capacity, anomaly, infrastructure DS. Классическая «облачная DS»: прогноз нагрузки на ЦОДы и GPU-пулы, anomaly detection на телеметрии, predictive maintenance дисков и сетевого оборудования. Стек — Python + Prophet + Catboost + ClickHouse. Подойдёт кандидатам с background в supply-chain, telco, индустриальной аналитике.
Customer analytics. B2B-аналитика: churn enterprise-клиентов, cross-sell сервисов, прогноз revenue по конкретному аккаунту. Стек — Catboost + GP/CH + SQL для скользящих окон. Похоже на банк, только клиентов меньше, а средний чек выше. Подойдёт DS с опытом в B2B SaaS или банковском segmentation.
AI R&D (через материнский Сбер). Часть AI-проектов R&D-формата — обучение моделей под клиентов или внутренние нужды Сбера. Сюда переходят senior DS, у кого нравится фундаментальная работа. Челленджи — GPU-кластеры, distributed training, оптимизация большой модели. Подойдёт кандидатам с PhD-уровнем или сильным DL-pet-проектом.
Что Cloud.ru ценит в DS
Production-опыт. Не Kaggle-experience, а модель в проде с цифрами. История «обучил классификатор оттока на банковских данных, +1.8% retention в когортном тесте, продакшен на K8s» бьёт любую медаль на соревнованиях.
Понимание стоимости. GPU-час — дорогой, и DS, который этого не учитывает, выглядит зелёным. На System Design ожидают, что ты обсудишь cost-per-prediction, GPU-utilization, batching. Если в ответе нет ни одного слова про деньги — балл проседает.
Универсальность. В Cloud.ru ценят DS, который может и в табличный ML, и в DL, и в инференс. Узкие специалисты только по NLP или только по CV рассматриваются точечно, в R&D-команде.
Weak vs strong на System Design. Слабый ответ: «возьмём fine-tune GigaChat для текстового модерирования». Сильный ответ: «сначала проверим, справится ли простой Catboost на эмбеддингах из small-модели — это в 100 раз дешевле в инференсе. Fine-tune GigaChat — только если на наших данных Catboost не пробьёт baseline, и при этом я заложу мониторинг GPU-utilization и автоматический rollback на дешёвую модель, если LLM-сервис деградирует».
Сбер-совместимость. Это важно: Cloud.ru — часть группы, процессы и культура отчасти Сберовские. Кандидат, который ругает корпоративные процессы на собесе, получит -1. Не нужно их любить, нужно показать, что ты готов работать в этой среде.
Self-management. Команды небольшие, нет толпы продактов и аналитиков, которые принесут готовое ТЗ. DS сам формулирует задачу, собирает данные, тестирует и катит в прод. Senior+ это знакомо, junior может быть тяжело.
Как готовиться: план
За 6-8 недель до планируемого собеса:
- Неделя 1-2 — Табличный ML и DL-база. Освежи Catboost (категориальные фичи, регуляризация, ordered boosting), логистическую регрессию и её интерпретацию. Параллельно — базовая DL-теория: PyTorch, optimizer, lr scheduling, как fine-tune небольшую модель (HuggingFace). Закрывай пробелы по теории на Карьернике: 1500+ задач по SQL, Python, статистике и ML, по 15 минут в день, чтобы за месяц закрыть базу и приходить на собес без «забыл, что такое L1-регуляризация».
- Неделя 3 — Алгоритмы. LeetCode Medium 30+ задач. Не растягивай — у Cloud.ru алгоритмическая часть умеренная, но базу спросят. Деревья, графы, динамика, hash map, two pointers.
- Неделя 4 — Python + Pandas. 20-30 задач на pandas (groupby, merge, time-series, transform, оконные через rank/cumsum). Освежи numpy базу.
- Неделя 5 — System Design кейсы. Прорешай 5-6 кейсов: ML-сервис для клиентов (AutoML, OCR), capacity GPU-кластера, churn enterprise, anomaly на телеметрии, fine-tuning-as-a-service. Структура — бизнес → метрики → данные → модель → MLOps → costing → A/B.
- Неделя 6 — MLOps и инференс. Базовое понимание: docker, K8s pods/deployments, model serving (Triton, BentoML), квантизация и distillation как методы ускорения. Не нужно быть DevOps, нужно говорить на их языке. MLOps, Model serving.
- Неделя 7-8 — Mocks и behavioral. Mock-интервью с друзьями, 5-7 STAR-историй: конфликт с заказчиком, факап с моделью, спор по архитектуре, история про экономию денег за счёт правильного выбора модели.
Частые ошибки
Не думают про деньги. На System Design кандидат проектирует решение из 5 миллиардов параметров на GPU H100, не упоминая costs. В облачном провайдере это сразу красный флаг — деньги это бизнес.
Хайпуют LLM на любых задачах. Кандидат предлагает GigaChat для классификации платежей. Спрашивают: «а простой Catboost?». Если не знаешь, как сравнивать — балл просядет.
Не разбираются в инференсе. «Обучил модель и отдал инженерам» — нерабочая позиция. Базовая разница online vs batch inference, latency vs throughput, ключевые техники ускорения должны быть в голове.
Боятся процессов. Cloud.ru — часть группы Сбер, процессов много. Кандидаты из чистых стартапов часто отказываются на финале, когда узнают про регламенты, согласования, security checks. Если процессы тебя пугают — лучше идти в Selectel или меньшие провайдеры.
Не умеют объяснять модель бизнесу. На финальном этапе часто просят: «объясни эту модель так, чтобы CFO Cloud.ru понял». Если кандидат сразу про градиенты и lazy gradient steps — балл проседает.
Связанные темы
- Собеседование на Data Scientist
- Классическая ML на собесе
- ML system design
- Собеседование на ML Engineer в Cloud.ru
- Собеседование на AI PM в Cloud.ru
FAQ
Удалёнка в Cloud.ru для DS?
Преимущественно гибрид с офисом в Москве (Кутузовский / Сбер-кампус). Полностью удалённая работа возможна для редких senior-кейсов, но скорее исключение. Уточняйте на скрининге.
Зарплатные вилки 2026?
Middle DS: 280-420k. Senior: 420-650k. Lead/Staff — выше, особенно в R&D. Сбер-бонусная схема (годовая премия), опционов нет. Соцпакет Сбера в полном объёме.
Нужен ли английский?
Базовый — для документации и статей. Свободного говорящего не требуется. Для R&D-команд и работы с международными библиотеками — желательнее.
Сколько этапов?
5-6 этапов, 4-6 недель от первого скрининга до оффера. У Сбер-группы согласования замедляют процесс, особенно в высоких грейдах.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.