Собеседование на Data Scientist в МегаФон
Содержание:
Почему МегаФон — особенный работодатель для DS
МегаФон — крупный российский телеком с ~75 млн абонентов. DS работает с гигантскими табличными данными: CDR (call detail records), биллинг, локации, активность абонентов. Главные задачи: churn prediction, антифрод, классификация B2B-клиентов, recsys в МегаФон ТВ и B2B-сервисах.
Особенность: телеком даёт DS уникальные данные — звонки, локации, мобильный интернет в режиме реального времени. Это даёт мощные фичи для ML, но требует знания privacy / regulator (закон о связи, СОРМ, 152-ФЗ). Подробнее — на странице карьеры МегаФона.
Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.
Этапы собеседования
1. Скрининг с рекрутером (30 минут)
Опыт, мотивация. Специфика:
- Был ли опыт с табличными данными большого объёма
- Знание классического ML
- Готовность работать с телеком-domain
2. SQL и Python (60 минут)
SQL — middle-senior. Python — pandas, sklearn, базовый pyspark.
3. ML-теория (60-90 минут)
- Classical ML: gradient boosting (CatBoost — фаворит)
- Несбалансированные классы (churn 2-5%, fraud 0,5%)
- Метрики classification: AUC, KS, lift, F1
- Survival analysis для LTV / time-to-churn
- Time series для нагрузки на сеть
4. ML system design (60 минут)
«Спроектируй модель churn premium-абонентов», «детекция fraud в платежах», «recsys в МегаФон ТВ».
5. Поведенческое + финал
STAR + стратегический разговор.
Что МегаФон ценит в DS
- Classical ML. Gradient boosting глубоко.
- Telecom-domain. ARPU, churn, MOU, абонентское поведение.
- Несбалансированные классы. Sampling, class weights, threshold tuning.
- Compliance. 152-ФЗ, закон о связи.
- Pragmatism. В телекоме часто простая модель ставится в прод.
Типичные задачи и кейсы
- «Спроектируй модель churn premium-абонентов»
- «Доля fraud 0,5%. Метрики? Как обучать?»
- «Recsys в МегаФон ТВ: фичи, модель»
- «Cross-sell: предсказание готовности абонента взять кредитную карту от партнёра»
- «LTV нового абонента на 24 месяца. Survival или regression?»
Как готовиться: план
- Classical ML. Gradient boosting глубоко.
- Несбалансированные данные. Sampling, class weights, threshold tuning.
- Метрики classification. AUC, KS, lift, F1, Gini, calibration.
- Survival analysis. Cox regression, Kaplan-Meier.
- Time series. Базовое для прогноза нагрузки.
- Compliance. 152-ФЗ, закон о связи.
Частые ошибки
- Зубрить deep learning без classical базы. В телеком-DS табличные данные.
- Игнорировать calibration. AUC не достаточно для скоринга.
- Не учитывать compliance. Локации абонентов — privacy.
- Слабая SQL. Без неё в команде телекома никуда.
Связанные темы
- Собеседование на DS в МТС
- Собеседование на DS в Альфа-Банке
- Causal inference: причинность vs корреляция
- Accuracy vs F1
- Собеседование на PM в МегаФон
FAQ
Сколько этапов в собеседовании на DS в МегаФоне?
Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 4-6 недель.
Нужен ли телеком-опыт?
Желателен для core-команд. Для digital (МегаФон ТВ) — релевантным считается subscription business.
Какой уровень SQL?
Уверенный middle-senior. CDR-таблицы большие.
Спрашивают ли deep learning?
В отдельных командах (NLP в support) — да. В core-телеком — редко.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.