Собеседование на Data Scientist в МТС
Содержание:
Почему МТС — особенный работодатель для DS
МТС — крупный телеком + digital-экосистема. DS работает на стыке: классические телеком-задачи (churn prediction, антифрод, anti-flapping, network optimization) и современные digital-продукты (рекомендации в КION, GigaChat, антифрод в МТС Банке, продуктовые ML-модели Premium).
Особенность: телеком-данные — это огромные объёмы behavioral (звонки, локации, трафик) + долгие истории отношений с клиентом. ML-модели здесь часто работают на годовых горизонтах (LTV, retention, lifetime risk). Параллельно — современные digital-команды с focus на product ML, recsys. Актуальные вакансии — на странице карьеры МТС.
Информация в статье основана на публичных источниках и опыте кандидатов. Формат собеседования отличается по командам и грейдам. Уточняйте у рекрутера.
Этапы собеседования
1. Скрининг с рекрутером (30 минут)
Опыт, мотивация. Особенности МТС:
- Опыт с телеком / финтех / classical ML на табличных данных
- Знание churn prediction, antifraud
- В какое направление интересно (core telecom / KION / Banking / Premium)
2. SQL и Python (45-60 минут)
Live-coding SQL на телеком-данных (transactions, активность абонентов, churn), Python (pandas, ML pipeline).
3. ML-теория (60-90 минут)
Главный этап. Темы:
- Classical ML: logistic regression, gradient boosting (CatBoost — фаворит в финтех/телеком)
- Несбалансированные классы (churn, fraud)
- Метрики: AUC, KS, lift, F1
- Survival analysis (для LTV / lifetime прогноза)
- Time series (для прогнозов трафика, нагрузки)
4. ML system design (60 минут)
«Спроектируй модель churn для подписки», «детекция fraud в платежах МТС Банка», «recommender для KION».
5. Поведенческое (45 минут)
STAR-вопросы.
6. Финал с лидом
Стратегический разговор.
Что МТС ценит в DS
- Classical ML. Gradient boosting, logistic regression — фундамент
- Понимание телеком-домена. Churn, ARPU, расчёты по сегментам
- Bias и fairness. В скоринге и антифроде важно избегать дискриминации
- Опыт между продуктами. МТС — экосистема, важно понимать связи между продуктами
- Compliance. Закон о связи, 152-ФЗ
Типичные задачи и кейсы
- «Спроектируй модель churn для тарифа. Фичи, модель, метрика, как бизнес использует»
- «Доля fraud — 0.1%. Какие метрики, как обучать?»
- «У абонентов разное поведение в день: звонки, интернет, локация. Как использовать?»
- «Recommender для KION: фичи, модель, как балансировать explore/exploit»
- «LTV нового абонента: прогноз на 24 месяца. Подход?»
Как готовиться: план
- Classical ML. Logistic regression, gradient boosting глубоко.
- Несбалансированные данные. Sampling, class weights, threshold tuning.
- Метрики classification. AUC, KS, lift, F1.
- Survival analysis. Для LTV и time-to-event задач.
- A/B и causal inference. CUPED.
- SQL. Cohorts, RFM, retention. SQL-раздел.
Частые ошибки
- Зубрить deep learning без classical базы. В телеком/банковской аналитике классика часто лучше
- Игнорировать интерпретируемость. Скоринг должен объясняться. SHAP, feature importance — обязательно
- Не учитывать compliance. В банковском DS — регулятор, в телеком — закон о связи
- Слабая SQL. Без неё в DS-команде телекома никуда
Связанные темы
- Собеседование на Data Scientist
- Собеседование на DS в Tinkoff
- Собеседование на DS в Sber AI
- Causal inference: причинность vs корреляция
- Accuracy vs F1
FAQ
Сколько этапов в собеседовании на DS в МТС?
Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 3-5 недель.
Нужен ли телеком-опыт?
Желателен для core-команд. Для digital (KION, Premium) — не обязателен, релевантен опыт с подписочными продуктами.
Какие алгоритмы спрашивают?
Classical ML (logistic regression, gradient boosting) — must. Survival analysis для LTV. Time series для нагрузки/трафика. Deep learning — в отдельных командах.
Спрашивают ли deep learning?
В KION / GigaChat — да. В core telecom — реже.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.