Собеседование на Data Scientist в MTS Cloud

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему MTS Cloud — особенный работодатель для DS

MTS Cloud (бренд MWS — MTS Web Services) — облачное подразделение группы МТС: IaaS, PaaS, managed-сервисы, объектное хранилище, ML-платформа, AI-сервисы поверх инфраструктуры МТС. Cloud занимает заметную долю на рынке корпоративных клиентов и активно растёт за счёт перехода государственных и регулируемых заказчиков на отечественные облака. Для DS это значит работу в большой телеком-группе с серьёзным B2B-фокусом: задачи скорее похожи на банковский B2B или telco, чем на классический e-commerce ML.

Главные ML-домены: прогноз нагрузки на ЦОДы и кластеры, anomaly detection в облачной инфраструктуре, predictive maintenance, churn и cross-sell enterprise-клиентов (включая внутреннюю клиентуру МТС-группы — крупный сегмент), AI-сервисы как продукт (OCR, ASR, image processing), антифрод на регистрациях и тарификации, иногда — расширения для telco-аналитики (если команда работает на стыке с MTS Big Data). Часть моделей — для внешних клиентов через API, часть — для внутренней оптимизации.

Стек: Python + Catboost + LightGBM + PyTorch для редких задач; ClickHouse и Greenplum для аналитики; Airflow и внутренние инструменты МТС для пайплайнов; Kubernetes; MLflow. Часть инфраструктуры наследуется от МТС Big Data: HDFS, Spark, Hive. В команде ощущается телеком-наследие: процессы выстроены, есть compliance и регламенты.

Актуальные вакансии — на hh.ru и сайте МТС.

Информация основана на публичных источниках и опыте кандидатов. Команды MTS Cloud используют разные процессы — формат зависит от направления и грейда, уточняйте у рекрутера.

Этапы собеседования

Полный цикл — 4-6 недель, 5-6 этапов. Процесс типичный для большой телеком-группы: HR, ML-теория, кодинг, продуктово-инфраструктурный кейс, поведенческое, финал. Для ролей с доступом к гос-облаку или регулируемым клиентам — отдельный этап compliance.

1. HR-скрининг (30-45 минут)

Рекрутер уточняет: production-опыт ML (от 1.5-2 лет), есть ли telco- или B2B-фон, знание классического облачного и big-data стека, мотивацию идти именно в MTS Cloud, ожидания по компенсации. МТС склонна нанимать кандидатов из telco, банков и других облачных провайдеров — упомяни в первые 60 секунд, если такой опыт есть. Готовь питч на 90 секунд про самый зрелый production-кейс с цифрами.

2. ML-теория (60-90 минут)

Базовая секция со старшим DS из команды. Темы: градиентный бустинг (Catboost / LightGBM, регуляризация, обработка категориальных фичей), классические методы (логистическая регрессия, метрики классификации, ROC-AUC vs PR-AUC при дисбалансе классов), feature engineering для табличных данных, time-series (Prophet, ARIMA, holdout-стратегии для рядов), методы детекции аномалий (Isolation Forest, autoencoders), базовые элементы DL если идёшь в AI-сервисы. Часто встречаются telco-специфичные кейсы: «как ты бы построил churn-модель для корпоративного клиента, который пользуется и связью, и облаком», «как обработать панельные данные с миллионами клиентов».

Подготовка: классическая ML, feature engineering.

3. Python + SQL live coding (60-90 минут)

1-2 задачи на алгоритмы (LeetCode Easy/Medium), 1-2 задачи на pandas (фильтры, groupby, оконные через transform и rank), 1-2 задачи на SQL (агрегаты, JOIN, window functions). Алгоритмическая планка — средняя, без LeetCode Hard. Часто встречается живая обработка реальных данных: «вот dataframe с логами биллинга, найди клиентов с аномальным ростом потребления за последние 3 месяца». Готовиться: 30-50 LeetCode Medium + 20 задач на pandas + 30 SQL-задач.

Подготовка: live coding.

4. ML System Design + Product кейс (90 минут)

Самая характерная секция. Кейс — продуктовый или инфраструктурный: «спроектируй churn-модель для корпоративных клиентов MTS Cloud», «как ты бы построил систему антифрода на регистрациях», «как сделать продукт OCR-сервиса для банковских клиентов». Нужно: уточнить бизнес-метрику, описать данные (внутренние + внешние), выбрать архитектуру, обсудить trade-off latency vs quality, мониторинг и A/B. Сильный сигнал — учёт compliance и регламентов МТС: «какие данные нельзя использовать, какие требуют дополнительного согласования». Слабый — игнорирование regulatory-контекста.

Подготовка: ML system design, метрики модели.

5. Поведенческое + culture fit (45-60 минут)

С тимлидом или представителем направления. STAR-формат: конфликт с заказчиком, факап в проде, спор по архитектуре, история про длинный регулируемый проект. МТС ценит кандидатов, готовых работать в зрелой корпоративной среде с долгими циклами согласования. Если ты пришёл из стартапа и тебе не нравятся регламенты — лучше озвучить это на скрининге, чем потом расставаться.

6. Финал с руководителем направления (30 минут)

Финальная встреча: грейд, оффер, иногда финальные сомнения. Не отсев, но возможны корректировки по цифрам.

Особенности по командам

Capacity и infrastructure DS. Команда занимается прогнозом нагрузки на ЦОДы и GPU-кластеры, планированием закупок железа, оптимизацией миграций ВМ. Стек — Python + Prophet + Catboost + ClickHouse + наследие Hive/Spark от MTS Big Data. Челлендж — учёт сезонности и больших миграций (один enterprise-клиент даёт огромный скачок). Подойдёт кандидатам с background в telco, supply-chain или энергетике.

AI Services. Команда строит AI-API: OCR, ASR, image processing, NLP-классификаторы. Тесно работает с командой MTS AI (которая делает их собственные LLM-проекты). Стек — PyTorch + Triton + TensorRT + кастомные инференс-сервера. Челленджи — latency, batching, оптимизация под GPU-парк, биллинг. Подойдёт DS с CV/NLP-фоном и желанием возиться с инференсом.

B2B-аналитика и customer DS. Команда занимается churn и cross-sell enterprise-клиентов, оценкой LTV, прогнозом revenue. Стек — Catboost + Greenplum + дашборды + SQL для скользящих окон. Челлендж — маленькая выборка enterprise-клиентов (тысячи, не миллионы), интерпретируемые фичи, готовность объяснить модель CFO. Подойдёт DS с background в банковском скоринге, B2B SaaS или telco.

Antifraud и security DS. Точечно: детекция фрода на регистрациях, аномалии в трафике, кибербез-сценарии. Стек — Python + Catboost + autoencoders + графовые методы. Подойдёт кандидатам с опытом в банковском антифроде или security.

Telco x Cloud DS. Уникальная для группы МТС: задачи на стыке telco-данных (сетевая телеметрия) и облачных продуктов. Например, как использовать сигналы из сети для предсказания churn облачных клиентов. Стек — наследие MTS Big Data (Hive, Spark) + современный ML-стек. Подойдёт кандидатам с серьёзным telco-фоном и аппетитом к большим данным.

Что MTS Cloud ценит в DS

Production-опыт. История про модель в проде с цифрами. «Сделал классификатор на Kaggle» — не история. «Запустил churn-модель для 50 тысяч B2B-клиентов, +1.2% retention в когортном тесте, продакшен на K8s» — это история.

Telco / B2B-контекст. Опыт в telco, банке или B2B SaaS даёт сильное преимущество. Кандидаты с чисто consumer-internet фоном (e-commerce, медиа) проходят, но с пониманием, что им придётся доучивать B2B-специфику.

Готовность к процессам. МТС — большая корпорация, регламенты и согласования есть. Если ты ругаешь корпоративные процессы на собесе — балл просядет. Если ты говоришь «понимаю, что в B2B и регуляторных кейсах нужно соблюдать регламенты, в прошлом работал так-то» — балл растёт.

Weak vs strong на System Design. Слабый ответ: «возьмём transformer для churn-модели B2B-клиентов». Сильный ответ: «начну с Catboost на топ-30 фичах из биллинга и логов потребления — это бьёт baseline и интерпретируемо для тимлида саппорта. Transformer — только если выйдем на потолок Catboost и при этом я заложу мониторинг качества по сегментам клиентов, потому что redistribution в обучающей выборке быстро ломает большие модели на маленькой B2B-выборке».

Универсальность. В MTS Cloud ценят DS, который может в табличный ML, time-series и базовый DL. Узкие специалисты — точечно в AI Services.

Self-management. Команды небольшие, продактов и аналитиков немного. DS сам формулирует, согласует, собирает данные, тестирует и катит.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 6-8 недель до планируемого собеса:

  1. Неделя 1-2 — Табличный ML и time-series. Catboost (категориальные фичи, регуляризация), валидация для рядов, Prophet и ARIMA. Прорешай 1-2 Kaggle-кейса с реальными данными. Параллельно — на Карьернике закрой пробелы по SQL, Python и базе ML: 1500+ задач, по 15 минут в день, чтобы за месяц перестать спотыкаться на «опиши разницу precision/recall» и «как валидировать time-series».
  2. Неделя 3 — Telco / B2B контекст. Прочитай 3-5 блогов про telco-аналитику (МТС Big Data, Билайн Cloud, Сбер B2B): формирует словарь. Если не работал в B2B — освежи понятия LTV, churn, ARPU, ARPPU, CAC, payback period.
  3. Неделя 4 — Python + SQL live coding. 30-50 LeetCode Easy/Medium, 20 задач на pandas, 30 SQL-задач на оконки и JOIN.
  4. Неделя 5 — System Design кейсы. Прорешай 5-6 кейсов: churn enterprise B2B, capacity-прогноз, anomaly на телеметрии, OCR-сервис как SaaS, антифрод. Структура — бизнес → метрики → данные → модель → MLOps → A/B → compliance. ML system design.
  5. Неделя 6 — MLOps и инфраструктура. Базовое: docker, K8s, model serving (Triton). Не нужно быть DevOps. Если возможно — пройди мини-курс по PySpark, телеком-данные часто там. MLOps.
  6. Неделя 7-8 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: конфликт с заказчиком, факап в проде, длинный регулируемый проект, кейс с непрозрачными данными.

Частые ошибки

Хайпуют LLM на B2B-задачах. Кандидат предлагает fine-tune LLM для churn-модели B2B-клиентов с выборкой 5000. Не понимает, что на такой выборке Catboost разнесёт LLM в пух и прах. На System Design это сразу видно.

Не разбираются в B2B-метриках. «Что такое retention в B2B» — встречный вопрос интервьюера. Если кандидат начинает рассказывать про DAU/MAU — балл проседает. В B2B retention считается на аккаунте и на revenue, не на DAU.

Не думают про compliance. В МТС с гос-облаком и регулируемыми клиентами compliance — важная часть жизни. На System Design кандидаты часто игнорируют: «какие данные мы вообще можем использовать?». Если не задал этот вопрос — балл проседает.

Не разбираются в инфраструктуре. «Я DS, я в Kubernetes не лезу» — нерабочая позиция в облачном провайдере. Базовое понимание K8s обязательно.

Не умеют объяснить, почему MTS Cloud. На скрининге часто спрашивают «почему мы, а не Яндекс/Cloud.ru/Selectel». Если кандидат говорит «вы первые ответили» — балл проседает. Нужен ответ про продукт и про синергию с группой МТС.

Связанные темы

FAQ

Удалёнка в MTS Cloud для DS?

Преимущественно гибрид с офисом в Москве (Воронцовская / Деловой центр МТС). Полностью удалёнка возможна точечно для senior+ при согласовании. Уточняйте на скрининге.

Зарплатные вилки 2026?

Middle DS: 270-420k. Senior: 420-650k. Lead/Staff — выше. Годовая премия в МТС-формате, опционов нет. Соцпакет группы МТС в полном объёме.

Нужен ли английский?

Базовый — для документации и статей. Свободного говорящего не требуется. Для AI Services и работы с международными библиотеками — желательнее.

Сколько этапов?

5-6 этапов, 4-6 недель от первого скрининга до оффера. Согласования замедляют процесс, особенно для высоких грейдов и ролей с допусками.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.