Собеседование на Data Scientist в Ростелеком
Содержание:
Почему Ростелеком — особенный работодатель для DS
Ростелеком — крупнейший государственный telco-оператор России: магистральная связь, B2C-интернет, мобильная связь (через дочку Tele2), цифровое ТВ Wink, IT-решения для госструктур, дочерние компании (Tele2, Ростелеком ИТ, Ростелеком-Солар). Для Data Scientist это очень специфический контекст: гигантская инфраструктура (десятки миллионов B2C-абонентов + сотни тысяч B2B), интеграции с гос-проектами (Госуслуги, единая биометрическая система ЕБС), сложная корпоративная структура с многими ДО.
Главные ML-домены: churn-prediction (B2C и B2B), ARPU/LTV-моделирование, network-аналитика (магистраль, домашний интернет), Wink-recsys (рекомендации видео-контента), антифрод, биометрические проекты (через ЕБС), прогноз спроса на новые услуги, иногда — аналитика для гос-проектов (через Ростелеком-ИТ).
Стек: Python + Catboost + LightGBM + PyTorch + Prophet; Greenplum и ClickHouse для аналитики; Hadoop/Spark для тяжёлых сетевых данных; MLflow; Airflow; для биометрии и Wink — кастомные стеки. Часть наследия от старого «Электросвязи», часть — современная.
Актуальные вакансии — на hh.ru и сайте Ростелекома.
Информация основана на публичных источниках и опыте кандидатов. Команды Ростелекома и его ДО используют разные процессы — формат, этапы и компенсация зависят от ДО и грейда, для гос-проектов обязательна СБ, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 5-8 недель, 5-6 этапов. Процесс корпоративный гос-периметра: HR, ML-теория, кодинг и SQL, продуктовый кейс, поведенческое, финал, СБ для гос-ролей.
1. HR-скрининг (30-45 минут)
Рекрутер уточняет: production-опыт ML (от 2 лет, желательно с telco, банковским или гос-сектором), знание стека, мотивацию идти в Ростелеком, ожидания по компенсации и формату (Москва, ДО в регионах). Готовь питч на 90 секунд про самый зрелый production-кейс.
2. ML-теория (60-90 минут)
Базовая секция со старшим DS из ДО. Темы: градиентный бустинг, классические методы, feature engineering для telco, time-series, методы детекции аномалий, базовый DL (если идёшь в Wink-recsys или биометрию). Специфический вопрос: «как ты бы построил churn-модель для домашнего интернета с учётом, что часть абонентов уходит при появлении конкурента в районе».
Подготовка: классическая ML, time series, feature engineering.
3. Python + SQL live coding (60-90 минут)
Задачи прагматичные: 1-2 на Python (pandas), 1-2 на SQL (оконки, JOIN). Часто живой кейс на telco или Wink-данных. Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.
Подготовка: live coding.
4. Продуктовый кейс (60-90 минут)
Кейс: «спроектируй churn-pipeline для 20М абонентов домашнего интернета», «как ты бы построил Wink-recsys с учётом разных типов контента (фильмы, сериалы, ТВ-каналы)», «как сделать pipeline для гос-проекта ЕБС с compliance». Нужно: уточнить требования, описать данные, выбрать модель, продумать пайплайн. Сильный сигнал — учёт гос-специфики (если идёшь в соответствующее ДО): compliance, длинные циклы, регуляторика.
Подготовка: ML system design.
5. Поведенческое + culture fit (45-60 минут)
С тимлидом или представителем ДО. STAR-формат: конфликт с регуляторами или гос-заказчиком, факап, длинный compliance-проект.
6. Финал + СБ (1-3 недели)
Грейд, оффер. Для гос-проектов — СБ-проверка.
Особенности по командам
Churn B2C и B2B. Команда строит churn-модели для миллионов абонентов B2C (домашний интернет, мобильная связь через Tele2) и тысяч B2B-клиентов. Стек — Catboost + Greenplum + интеграция с CRM. Челлендж — два разных сегмента с разной экономикой. Подойдёт DS с B2C-аналитикой.
Network DS. Команда работает с сетевой аналитикой: магистральные каналы, домашний интернет, прогноз нагрузки, оптимизация. Стек — Python + Spark + Hadoop + специализированные telco-системы. Подойдёт DS с инженерным бэкграундом.
Wink (видео-сервис). Команда строит recsys для Wink: фильмы, сериалы, ТВ-каналы. Стек — PyTorch + Catboost + ClickHouse + кастомные feature stores. Подойдёт DS с recsys-фоном.
Биометрия и ЕБС. Команда работает с биометрическими проектами (Единая биометрическая система). Стек — PyTorch + специализированные CV/Speech-инструменты + compliance-инфраструктура. Подойдёт DS с CV/Speech-фоном.
Ростелеком-ИТ (гос-проекты). Команда занимается ML для гос-проектов через Ростелеком-ИТ. Стек — корпоративный + специализированные системы. Подойдёт DS с интересом к гос-сектору и compliance.
Что Ростелеком ценит в DS
Telco / B2C-контекст. Опыт в telco, banking, гос-секторе — большой плюс.
Готовность к гос-проектам и compliance. Для соответствующих ДО — критично.
Production-опыт. История про модель в проде с количественным эффектом.
Weak vs strong на System Design. Слабый ответ: «возьмём GBM для churn». Сильный ответ: «churn в домашнем интернете — два разных события: voluntary (ушёл к конкуренту в районе) и involuntary (заблокировали за неоплату). Делю на два классификатора. Для voluntary — Catboost с фичами market intelligence (когда в районе появляется конкурент — растёт risk). Для involuntary — Catboost с фичами биллинга. Treatment-стратегии разные. На каждом этапе compliance с 152-ФЗ (защита персональных данных)».
Готовность к корпоративной среде гос-периметра. Ростелеком — государственная компания.
Self-management. Циклы длинные.
Как готовиться: план
За 6-8 недель до планируемого собеса:
- Неделя 1-2 — Табличный ML и time-series. Catboost/LightGBM, Prophet, ARIMA, методы детекции аномалий. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день.
- Неделя 3 — Telco и гос-сектор контекст. Прочитай блоги МТС Big Data, ВымпелКом IT, обзоры по telco. Запомни понятия: ARPU, ARPPU, churn (voluntary/involuntary), MOU, ЕБС, 152-ФЗ.
- Неделя 4 — Python + SQL live coding. 30-50 SQL Medium-Hard задач + 20 простых на pandas.
- Неделя 5 — System Design кейсы. Прорешай 5-6 кейсов: churn для домашнего интернета, Wink-recsys, network forecast, биометрия с compliance, гос-проект-аналитика. ML system design.
- Неделя 6-8 — Mocks и behavioral + СБ-документы. Mock-интервью, 5-7 STAR-историй.
Частые ошибки
Не разбираются в telco-метриках. «Что такое ARPU, churn для домашнего интернета?» — кандидат теряется.
Игнорируют гос-специфику. В Ростелеком-ИТ или биометрии compliance — критическая часть.
Хайпуют сложными моделями. На telco-табличке Catboost обычно выигрывает.
Не задают вопросы про market intelligence. Churn в B2C зависит от появления конкурентов в районе. Кандидат, который этого не упоминает, теряет балл.
Не готовы к СБ. Для гос-проектов СБ — норма.
Связанные темы
- Собеседование на Data Scientist
- Feature engineering
- Time series на собесе
- Собеседование на Data Scientist в Tele2
- Собеседование на Data Scientist в ТТК
FAQ
Удалёнка в Ростелекоме для DS?
Гибрид с офисами в Москве и ДО в регионах. Полная удалёнка возможна для senior+. Для гос-проектов — обычно офис.
Зарплатные вилки 2026?
Зависит от ДО. Middle DS: 230-360k. Senior: 360-560k. Lead — выше, особенно в Wink и биометрии.
Нужен ли английский?
Базовый — для документации.
Сколько этапов?
5-6 этапов, 5-8 недель из-за corporate-согласований и СБ для гос-ролей.
Реально ли пройти без telco-опыта?
Реально на middle-позицию в B2C-команды. Для гос-проектов — сложнее без compliance-опыта.
Какие книги и ресурсы помогут подготовиться?
«Designing Data-Intensive Applications», статьи МТС Big Data, обзоры по telco. По SQL — задачник Карьерника.
Что подчеркнуть на финале?
Опыт работы с B2C-аналитикой на масштабе, готовность к корпоративной среде гос-периметра, понимание compliance.
Чем работа в Ростелекоме отличается от других telco?
Ростелеком — государственная компания с гигантской структурой и десятками ДО. По сравнению с приватными МТС/МегаФон/Билайн — больше corporate-процессов и compliance, длиннее циклы согласования. По сравнению с Tele2 (дочкой Ростелекома) — больше масштаба и разнообразия проектов.
Сколько собесов параллельно вести?
3-4 telco-компании или гос-компании в смежных сегментах. Если интересен B2C — Tele2, МегаФон, Билайн; если ШПД — Ростелеком, ЭР-Телеком; если гос-проекты — Ростелеком, ЦФТ, T1, ИБС.
Какие архитектурные кейсы стоит подготовить?
Churn для ШПД с географической спецификой, Wink-recsys для видео-сервиса, биометрия с ЕБС-compliance, гос-проект-аналитика, network forecast для магистрали.
Реально ли пройти на удалёнке?
Для B2C-аналитических ролей и Wink — возможно. Для гос-проектов и биометрии — обычно офис.
Какие книги и ресурсы дополнительно помогут?
Дополнительно к «Designing Data-Intensive Applications» — статьи по retail-DWH (для Wink), документация по 152-ФЗ и ЕБС, обзоры по B2C-telco в РФ. Также полезно посмотреть несколько публичных докладов руководителей Ростелеком-ИТ про data infrastructure гос-проектов.
Сколько готовиться к собесу в Ростелекоме?
В среднем 6-8 недель, если есть опыт в telco или B2C. Для гос-ролей — 8-12 недель из-за дополнительной СБ-подготовки.
Какие особенности нужно знать про Wink?
Wink — крупнейший российский видео-сервис, особенно сильный по подписочному контенту, спорту и live-каналам. Recsys в Wink имеет свою специфику: VOD vs live-каналы требуют разных моделей, важна работа с cold-start для новых сериалов и фильмов.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по ДО.