Собеседование на Data Scientist в МегаФон

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему МегаФон — особенный работодатель для DS

МегаФон — крупный российский телеком с ~75 млн абонентов. DS работает с гигантскими табличными данными: CDR (call detail records), биллинг, локации, активность абонентов. Главные задачи: churn prediction, антифрод, классификация B2B-клиентов, recsys в МегаФон ТВ и B2B-сервисах.

Особенность: телеком даёт DS уникальные данные — звонки, локации, мобильный интернет в режиме реального времени. Это даёт мощные фичи для ML, но требует знания privacy / regulator (закон о связи, СОРМ, 152-ФЗ). Подробнее — на странице карьеры МегаФона.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30 минут)

Опыт, мотивация. Специфика:

  • Был ли опыт с табличными данными большого объёма
  • Знание классического ML
  • Готовность работать с телеком-domain

2. SQL и Python (60 минут)

SQL — middle-senior. Python — pandas, sklearn, базовый pyspark.

3. ML-теория (60-90 минут)

  • Classical ML: gradient boosting (CatBoost — фаворит)
  • Несбалансированные классы (churn 2-5%, fraud 0,5%)
  • Метрики classification: AUC, KS, lift, F1
  • Survival analysis для LTV / time-to-churn
  • Time series для нагрузки на сеть

4. ML system design (60 минут)

«Спроектируй модель churn premium-абонентов», «детекция fraud в платежах», «recsys в МегаФон ТВ».

5. Поведенческое + финал

STAR + стратегический разговор.

Что МегаФон ценит в DS

  • Classical ML. Gradient boosting глубоко.
  • Telecom-domain. ARPU, churn, MOU, абонентское поведение.
  • Несбалансированные классы. Sampling, class weights, threshold tuning.
  • Compliance. 152-ФЗ, закон о связи.
  • Pragmatism. В телекоме часто простая модель ставится в прод.

Типичные задачи и кейсы

  • «Спроектируй модель churn premium-абонентов»
  • «Доля fraud 0,5%. Метрики? Как обучать?»
  • «Recsys в МегаФон ТВ: фичи, модель»
  • «Cross-sell: предсказание готовности абонента взять кредитную карту от партнёра»
  • «LTV нового абонента на 24 месяца. Survival или regression?»
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. Classical ML. Gradient boosting глубоко.
  2. Несбалансированные данные. Sampling, class weights, threshold tuning.
  3. Метрики classification. AUC, KS, lift, F1, Gini, calibration.
  4. Survival analysis. Cox regression, Kaplan-Meier.
  5. Time series. Базовое для прогноза нагрузки.
  6. Compliance. 152-ФЗ, закон о связи.

Частые ошибки

  • Зубрить deep learning без classical базы. В телеком-DS табличные данные.
  • Игнорировать calibration. AUC не достаточно для скоринга.
  • Не учитывать compliance. Локации абонентов — privacy.
  • Слабая SQL. Без неё в команде телекома никуда.

Связанные темы

FAQ

Сколько этапов в собеседовании на DS в МегаФоне?

Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 4-6 недель.

Нужен ли телеком-опыт?

Желателен для core-команд. Для digital (МегаФон ТВ) — релевантным считается subscription business.

Какой уровень SQL?

Уверенный middle-senior. CDR-таблицы большие.

Спрашивают ли deep learning?

В отдельных командах (NLP в support) — да. В core-телеком — редко.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.