Собеседование на Data Scientist в Tele2
Содержание:
Почему Tele2 — особенный работодатель для DS
Tele2 (с 2024 года T2 RU) — четвёртый федеральный мобильный оператор России, дочка Ростелекома: десятки миллионов абонентов, активный B2C-фокус, известная маркетинговая стратегия «другие правила». Для Data Scientist это типичный telco-контекст: огромный поток сетевой и биллинговой телеметрии, churn-моделирование, ARPU-оптимизация, антифрод, но с особенностью — Tele2 исторически делает ставку на data-driven маркетинг и сегментацию.
Главные ML-домены: churn-prediction абонентов (мобильная связь — высокий churn в РФ), ARPU- и LTV-моделирование, next-best-offer и upsell, network-аналитика (использование сети, прогноз нагрузки, оптимизация частотного ресурса), антифрод на регистрациях и мошенничестве с тарифами, прогноз спроса на новые тарифы, сегментация по поведению, иногда — обработка обращений в саппорт через NLP.
Стек: Python + Catboost + LightGBM + scikit-learn + Prophet; Greenplum и ClickHouse для аналитики; Hadoop/Spark для тяжёлых сетевых данных; MLflow для трекинга; Airflow для пайплайнов. Часть инфраструктуры наследуется от Ростелекома, часть — собственная Tele2.
Актуальные вакансии — на hh.ru и сайте Tele2.
Информация основана на публичных источниках и опыте кандидатов. Команды Tele2 используют разные процессы — формат и этапы зависят от направления и грейда, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 4-6 недель, 5-6 этапов. Процесс корпоративный telco: HR, ML-теория, кодинг и SQL, продуктовый кейс, поведенческое, финал.
1. HR-скрининг (30-45 минут)
Рекрутер уточняет: production-опыт ML (от 1.5-2 лет, желательно с telco, банковским или fintech-контекстом), знание стека, мотивацию идти в Tele2, ожидания по компенсации и формату (Москва, частично гибрид). Готовь питч на 90 секунд про самый зрелый production-кейс.
2. ML-теория (60-90 минут)
Базовая секция со старшим DS из команды. Темы: градиентный бустинг (Catboost/LightGBM, регуляризация, обработка категориальных), классические методы (логистическая регрессия с интерпретацией, метрики, ROC-AUC vs PR-AUC при дисбалансе), feature engineering для telco-данных (агрегаты по биллингу, паттерны звонков, использование сети), time-series (Prophet, ARIMA, сезонность), методы детекции аномалий (для антифрода). Специфический вопрос: «как ты бы построил churn-модель с учётом, что часть абонентов уходит из-за плохого покрытия сети, а часть — из-за тарифной политики, и эти причины требуют разных treatment-стратегий».
Подготовка: классическая ML, feature engineering, time series.
3. Python + SQL live coding (60-90 минут)
Задачи прагматичные: 1-2 на Python (pandas, базовые алгоритмы), 1-2 на SQL (оконки, агрегаты на биллинг-данных, JOIN). Часто живой кейс: «дам тебе фрейм с активностью абонентов и историей платежей, посчитай вероятность churn в следующем месяце». Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.
Подготовка: live coding.
4. Продуктовый кейс (60-90 минут)
Самая характерная секция. Кейс продуктовый: «спроектируй churn-pipeline для 30М абонентов с интеграцией маркетинговой команды для retention-кампаний», «как ты бы построил next-best-offer для upsell тарифа», «как сделать антифрод на манипуляциях с тарифами и SIM-картами». Нужно: уточнить бизнес-метрику, описать данные, выбрать модель, продумать пайплайн, заложить мониторинг. Сильный сигнал — учёт telco-специфики: long-tail сегменты абонентов, разные causes для churn, особенности biling-данных.
Подготовка: ML system design, метрики модели.
5. Поведенческое + culture fit (45 минут)
С тимлидом или представителем команды. STAR-формат: конфликт с маркетингом, факап с моделью в проде, длинный проект.
6. Финал с руководителем (30 минут)
Грейд, оффер.
Особенности по командам
Churn & retention DS. Команда строит churn-модели и инструменты для retention-кампаний. Стек — Catboost + Greenplum + ClickHouse + интеграция с CRM-системой Tele2. Челлендж — разные causes для churn (price, network, alternative offers), длинный feedback loop (отток виден через 1-3 месяца). Подойдёт DS с background в B2C-аналитике или CRM.
ARPU и upsell. Команда занимается ARPU-моделированием и рекомендациями upsell-тарифов. Стек — Catboost + Greenplum + кастомные feature stores. Подойдёт DS с product analytics или recsys фоном.
Network DS. Команда работает с сетевой аналитикой: прогноз нагрузки на базовые станции, оптимизация частотного ресурса, проблемные зоны связи. Стек — Python + Spark + Hadoop + специализированные telco-системы. Подойдёт DS с инженерным или физико-математическим бэкграундом.
Антифрод и trust. Команда строит pipeline антифрода на регистрациях SIM, манипуляциях с тарифами. Стек — Catboost + графовые методы + Spark. Подойдёт DS с security или антифрод-background.
B2B-сегмент. Команда занимается B2B-клиентами Tele2 (корпоративные тарифы, юр.лица). Стек — Catboost + Greenplum + дашборды. Подойдёт DS с B2B-аналитикой или sales-фоном.
Что Tele2 ценит в DS
Production-опыт. История про модель в проде с цифрами. «Запустил churn-модель на 20М абонентов, +1.4% retention в когортном A/B на 3 месяца» — это история.
Telco / B2C-контекст. Опыт в telco, banking, ритейле или streaming-сервисах — большой плюс.
Прагматизм над хайпом. В Tele2 ценят Catboost и Prophet, а не «возьмём transformer на последовательностях звонков».
Weak vs strong на System Design. Слабый ответ: «возьмём GBM для churn-прогноза». Сильный ответ: «churn в telco — это два разных события: voluntary (абонент сам ушёл) и involuntary (заблокирован за неоплату). Делю на два классификатора. Для voluntary — Catboost на behavioral-фичах с горизонтом 30 дней. Для involuntary — отдельная модель с фичами биллинга. На каждую модель — отдельная treatment-стратегия: voluntary — promo-offer от маркетинга, involuntary — soft-collection. Метрика — не AUC, а revenue saved в когортном A/B».
Готовность к корпоративной среде. Tele2 — часть Ростелекома, регламентов хватает.
Self-management. Команды компактные.
Как готовиться: план
За 5-7 недель до планируемого собеса:
- Неделя 1-2 — Табличный ML и time-series. Catboost/LightGBM, валидация для рядов, Prophet, ARIMA. Прорешай 1-2 Kaggle-кейса на telco-данных. Параллельно — на Карьернике обнови базу по SQL, Python и ML: 1500+ задач, по 15-20 минут в день.
- Неделя 3 — Telco-контекст. Прочитай блог МТС Big Data, ВымпелКом IT, обзоры по telco-аналитике. Запомни понятия: ARPU, ARPPU, churn (voluntary/involuntary), MOU, ADV, SIM-блокировка.
- Неделя 4 — Python + SQL live coding. 30-50 SQL Medium-Hard задач + 20 простых на pandas.
- Неделя 5 — System Design кейсы. Прорешай 5-6 кейсов: churn 30М абонентов, ARPU upsell, network-аналитика, антифрод SIM, B2B-segmentation. ML system design.
- Неделя 6-7 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй.
Частые ошибки
Хайпуют сложными моделями. Кандидат предлагает огромную нейронку для churn. На telco-табличке Catboost обычно выигрывает.
Не разбираются в telco-метриках. «Что такое ARPU, MOU, voluntary vs involuntary churn?» — кандидат теряется.
Игнорируют долгий feedback loop. Churn виден через месяцы. Кандидат, который не учитывает это в дизайне A/B-теста, теряет балл.
Не задают вопросы про данные. На кейсе сразу — модель, а не «какие данные есть в биллинге, какая частота, какие пропуски».
Не думают про causes для churn. Одна модель «churn vs no churn» в telco — слабо. Нужно отделять voluntary от involuntary.
Связанные темы
- Собеседование на Data Scientist
- Feature engineering
- Time series на собесе
- Собеседование на Data Scientist в МТС
- Собеседование на Data Scientist в Билайне
FAQ
Удалёнка в Tele2 для DS?
Гибрид с офисом в Москве. Полная удалёнка возможна для отдельных позиций (особенно senior+).
Зарплатные вилки 2026?
Middle DS: 230-360k. Senior: 360-560k. Lead — выше, особенно в churn и network-направлениях.
Нужен ли английский?
Базовый — для документации. Свободного говорящего не требуется.
Сколько этапов?
5-6 этапов, 4-6 недель.
Реально ли пройти без telco-опыта?
Реально на middle-позицию, если есть опыт с B2C-аналитикой или CRM (банки, ритейл). Telco-словарь подучить можно.
Какие книги и ресурсы помогут подготовиться?
«Designing Data-Intensive Applications», статьи МТС Big Data, обзоры по telco-аналитике. По SQL — задачник Карьерника.
Что подчеркнуть на финале?
Опыт работы с B2C-данными и churn, понимание long-tail сегментов, готовность работать с маркетинговой командой над retention-кампаниями.
Чем работа в Tele2 отличается от других telco?
Tele2 — четвёртый федеральный с ставкой на data-driven маркетинг и нестандартное позиционирование. По сравнению с МТС и МегаФон (где больше масштаба и регуляторики), Tele2 — более продуктовая компания с быстрыми циклами. По сравнению с Билайном — меньше legacy. По сравнению с Yota (которая внутри МегаФона) — Tele2 более крупный самостоятельный игрок.
Сколько собесов параллельно вести?
3-4 telco-компании одновременно (Tele2, МТС, МегаФон, Билайн, Yota) — позволяет калибровать офферы и формат работы. Параллельные собесы рационально вести в близких сегментах — telco-словарь общий.
Какие архитектурные кейсы стоит подготовить?
Churn-pipeline на 30М абонентов с voluntary/involuntary split, ARPU upsell с next-best-offer, network load forecast, антифрод SIM-related, B2B-segmentation. Полезно также подготовить кейс про A/B-инфраструктуру для тестирования новых тарифных продуктов на десятках миллионов абонентов одновременно.
Сколько готовиться к собесу в Tele2?
В среднем 5-7 недель, если уже есть опыт в telco или B2C-аналитике. Без profile-опыта — 8-10 недель, нужно доучить telco-словарь и понять специфику mobile retention.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.