13 мая 2026 г.·4 мин чтения

Собеседование на Data Scientist в МТС

Проверь себя · 1/3разбор после ответа

Вы сделали 2000 повторов bootstrap для разницы средних A−B и получили 2000 значений разницы. Что из этого является эмпирическим распределением разницы средних?

Содержание:

Почему МТС — особенный работодатель для DS
Этапы собеседования
Что МТС ценит в DS
Типичные задачи и кейсы
Как готовиться: план
Частые ошибки
Связанные темы
FAQ

Почему МТС — особенный работодатель для DS

МТС — крупный телеком + digital-экосистема. DS работает на стыке: классические телеком-задачи (churn prediction, антифрод, anti-flapping, network optimization) и современные digital-продукты (рекомендации в КION, GigaChat, антифрод в МТС Банке, продуктовые ML-модели Premium).

Особенность: телеком-данные — это огромные объёмы behavioral (звонки, локации, трафик) + долгие истории отношений с клиентом. ML-модели здесь часто работают на годовых горизонтах (LTV, retention, lifetime risk). Параллельно — современные digital-команды с focus на product ML, recsys. Актуальные вакансии — на странице карьеры МТС.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат собеседования отличается по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30 минут)

Опыт, мотивация. Особенности МТС:

Опыт с телеком / финтех / classical ML на табличных данных
Знание churn prediction, antifraud
В какое направление интересно (core telecom / KION / Banking / Premium)

2. SQL и Python (45-60 минут)

Live-coding SQL на телеком-данных (transactions, активность абонентов, churn), Python (pandas, ML pipeline).

3. ML-теория (60-90 минут)

Главный этап. Темы:

Classical ML: logistic regression, gradient boosting (CatBoost — фаворит в финтех/телеком)
Несбалансированные классы (churn, fraud)
Метрики: AUC, KS, lift, F1
Survival analysis (для LTV / lifetime прогноза)
Time series (для прогнозов трафика, нагрузки)

4. ML system design (60 минут)

«Спроектируй модель churn для подписки», «детекция fraud в платежах МТС Банка», «recommender для KION».

5. Поведенческое (45 минут)

STAR-вопросы.

6. Финал с лидом

Стратегический разговор.

Что МТС ценит в DS

Classical ML. Gradient boosting, logistic regression — фундамент
Понимание телеком-домена. Churn, ARPU, расчёты по сегментам
Bias и fairness. В скоринге и антифроде важно избегать дискриминации
Опыт между продуктами. МТС — экосистема, важно понимать связи между продуктами
Compliance. Закон о связи, 152-ФЗ

Типичные задачи и кейсы

«Спроектируй модель churn для тарифа. Фичи, модель, метрика, как бизнес использует»
«Доля fraud — 0.1%. Какие метрики, как обучать?»
«У абонентов разное поведение в день: звонки, интернет, локация. Как использовать?»
«Recommender для KION: фичи, модель, как балансировать explore/exploit»
«LTV нового абонента: прогноз на 24 месяца. Подход?»

Готовься к собесу аналитика как в Duolingo

10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram

Открыть Карьерник в Telegram

Как готовиться: план

Classical ML. Logistic regression, gradient boosting глубоко.
Несбалансированные данные. Sampling, class weights, threshold tuning.
Метрики classification. AUC, KS, lift, F1.
Survival analysis. Для LTV и time-to-event задач.
A/B и causal inference. CUPED.
SQL. Cohorts, RFM, retention. SQL-раздел.

Частые ошибки

Зубрить deep learning без classical базы. В телеком/банковской аналитике классика часто лучше
Игнорировать интерпретируемость. Скоринг должен объясняться. SHAP, feature importance — обязательно
Не учитывать compliance. В банковском DS — регулятор, в телеком — закон о связи
Слабая SQL. Без неё в DS-команде телекома никуда

Связанные темы

FAQ

Сколько этапов в собеседовании на DS в МТС?

Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 3-5 недель.

Нужен ли телеком-опыт?

Желателен для core-команд. Для digital (KION, Premium) — не обязателен, релевантен опыт с подписочными продуктами.

Какие алгоритмы спрашивают?

Classical ML (logistic regression, gradient boosting) — must. Survival analysis для LTV. Time series для нагрузки/трафика. Deep learning — в отдельных командах.

Спрашивают ли deep learning?

В KION / GigaChat — да. В core telecom — реже.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.