Собеседование на Data Scientist в Ростелеком

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Ростелеком — особенный работодатель для DS

Ростелеком — крупнейший государственный telco-оператор России: магистральная связь, B2C-интернет, мобильная связь (через дочку Tele2), цифровое ТВ Wink, IT-решения для госструктур, дочерние компании (Tele2, Ростелеком ИТ, Ростелеком-Солар). Для Data Scientist это очень специфический контекст: гигантская инфраструктура (десятки миллионов B2C-абонентов + сотни тысяч B2B), интеграции с гос-проектами (Госуслуги, единая биометрическая система ЕБС), сложная корпоративная структура с многими ДО.

Главные ML-домены: churn-prediction (B2C и B2B), ARPU/LTV-моделирование, network-аналитика (магистраль, домашний интернет), Wink-recsys (рекомендации видео-контента), антифрод, биометрические проекты (через ЕБС), прогноз спроса на новые услуги, иногда — аналитика для гос-проектов (через Ростелеком-ИТ).

Стек: Python + Catboost + LightGBM + PyTorch + Prophet; Greenplum и ClickHouse для аналитики; Hadoop/Spark для тяжёлых сетевых данных; MLflow; Airflow; для биометрии и Wink — кастомные стеки. Часть наследия от старого «Электросвязи», часть — современная.

Актуальные вакансии — на hh.ru и сайте Ростелекома.

Информация основана на публичных источниках и опыте кандидатов. Команды Ростелекома и его ДО используют разные процессы — формат, этапы и компенсация зависят от ДО и грейда, для гос-проектов обязательна СБ, уточняйте у рекрутера.

Этапы собеседования

Полный цикл — 5-8 недель, 5-6 этапов. Процесс корпоративный гос-периметра: HR, ML-теория, кодинг и SQL, продуктовый кейс, поведенческое, финал, СБ для гос-ролей.

1. HR-скрининг (30-45 минут)

Рекрутер уточняет: production-опыт ML (от 2 лет, желательно с telco, банковским или гос-сектором), знание стека, мотивацию идти в Ростелеком, ожидания по компенсации и формату (Москва, ДО в регионах). Готовь питч на 90 секунд про самый зрелый production-кейс.

2. ML-теория (60-90 минут)

Базовая секция со старшим DS из ДО. Темы: градиентный бустинг, классические методы, feature engineering для telco, time-series, методы детекции аномалий, базовый DL (если идёшь в Wink-recsys или биометрию). Специфический вопрос: «как ты бы построил churn-модель для домашнего интернета с учётом, что часть абонентов уходит при появлении конкурента в районе».

Подготовка: классическая ML, time series, feature engineering.

3. Python + SQL live coding (60-90 минут)

Задачи прагматичные: 1-2 на Python (pandas), 1-2 на SQL (оконки, JOIN). Часто живой кейс на telco или Wink-данных. Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.

Подготовка: live coding.

4. Продуктовый кейс (60-90 минут)

Кейс: «спроектируй churn-pipeline для 20М абонентов домашнего интернета», «как ты бы построил Wink-recsys с учётом разных типов контента (фильмы, сериалы, ТВ-каналы)», «как сделать pipeline для гос-проекта ЕБС с compliance». Нужно: уточнить требования, описать данные, выбрать модель, продумать пайплайн. Сильный сигнал — учёт гос-специфики (если идёшь в соответствующее ДО): compliance, длинные циклы, регуляторика.

Подготовка: ML system design.

5. Поведенческое + culture fit (45-60 минут)

С тимлидом или представителем ДО. STAR-формат: конфликт с регуляторами или гос-заказчиком, факап, длинный compliance-проект.

6. Финал + СБ (1-3 недели)

Грейд, оффер. Для гос-проектов — СБ-проверка.

Особенности по командам

Churn B2C и B2B. Команда строит churn-модели для миллионов абонентов B2C (домашний интернет, мобильная связь через Tele2) и тысяч B2B-клиентов. Стек — Catboost + Greenplum + интеграция с CRM. Челлендж — два разных сегмента с разной экономикой. Подойдёт DS с B2C-аналитикой.

Network DS. Команда работает с сетевой аналитикой: магистральные каналы, домашний интернет, прогноз нагрузки, оптимизация. Стек — Python + Spark + Hadoop + специализированные telco-системы. Подойдёт DS с инженерным бэкграундом.

Wink (видео-сервис). Команда строит recsys для Wink: фильмы, сериалы, ТВ-каналы. Стек — PyTorch + Catboost + ClickHouse + кастомные feature stores. Подойдёт DS с recsys-фоном.

Биометрия и ЕБС. Команда работает с биометрическими проектами (Единая биометрическая система). Стек — PyTorch + специализированные CV/Speech-инструменты + compliance-инфраструктура. Подойдёт DS с CV/Speech-фоном.

Ростелеком-ИТ (гос-проекты). Команда занимается ML для гос-проектов через Ростелеком-ИТ. Стек — корпоративный + специализированные системы. Подойдёт DS с интересом к гос-сектору и compliance.

Что Ростелеком ценит в DS

Telco / B2C-контекст. Опыт в telco, banking, гос-секторе — большой плюс.

Готовность к гос-проектам и compliance. Для соответствующих ДО — критично.

Production-опыт. История про модель в проде с количественным эффектом.

Weak vs strong на System Design. Слабый ответ: «возьмём GBM для churn». Сильный ответ: «churn в домашнем интернете — два разных события: voluntary (ушёл к конкуренту в районе) и involuntary (заблокировали за неоплату). Делю на два классификатора. Для voluntary — Catboost с фичами market intelligence (когда в районе появляется конкурент — растёт risk). Для involuntary — Catboost с фичами биллинга. Treatment-стратегии разные. На каждом этапе compliance с 152-ФЗ (защита персональных данных)».

Готовность к корпоративной среде гос-периметра. Ростелеком — государственная компания.

Self-management. Циклы длинные.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 6-8 недель до планируемого собеса:

  1. Неделя 1-2 — Табличный ML и time-series. Catboost/LightGBM, Prophet, ARIMA, методы детекции аномалий. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день.
  2. Неделя 3 — Telco и гос-сектор контекст. Прочитай блоги МТС Big Data, ВымпелКом IT, обзоры по telco. Запомни понятия: ARPU, ARPPU, churn (voluntary/involuntary), MOU, ЕБС, 152-ФЗ.
  3. Неделя 4 — Python + SQL live coding. 30-50 SQL Medium-Hard задач + 20 простых на pandas.
  4. Неделя 5 — System Design кейсы. Прорешай 5-6 кейсов: churn для домашнего интернета, Wink-recsys, network forecast, биометрия с compliance, гос-проект-аналитика. ML system design.
  5. Неделя 6-8 — Mocks и behavioral + СБ-документы. Mock-интервью, 5-7 STAR-историй.

Частые ошибки

Не разбираются в telco-метриках. «Что такое ARPU, churn для домашнего интернета?» — кандидат теряется.

Игнорируют гос-специфику. В Ростелеком-ИТ или биометрии compliance — критическая часть.

Хайпуют сложными моделями. На telco-табличке Catboost обычно выигрывает.

Не задают вопросы про market intelligence. Churn в B2C зависит от появления конкурентов в районе. Кандидат, который этого не упоминает, теряет балл.

Не готовы к СБ. Для гос-проектов СБ — норма.

Связанные темы

FAQ

Удалёнка в Ростелекоме для DS?

Гибрид с офисами в Москве и ДО в регионах. Полная удалёнка возможна для senior+. Для гос-проектов — обычно офис.

Зарплатные вилки 2026?

Зависит от ДО. Middle DS: 230-360k. Senior: 360-560k. Lead — выше, особенно в Wink и биометрии.

Нужен ли английский?

Базовый — для документации.

Сколько этапов?

5-6 этапов, 5-8 недель из-за corporate-согласований и СБ для гос-ролей.

Реально ли пройти без telco-опыта?

Реально на middle-позицию в B2C-команды. Для гос-проектов — сложнее без compliance-опыта.

Какие книги и ресурсы помогут подготовиться?

«Designing Data-Intensive Applications», статьи МТС Big Data, обзоры по telco. По SQL — задачник Карьерника.

Что подчеркнуть на финале?

Опыт работы с B2C-аналитикой на масштабе, готовность к корпоративной среде гос-периметра, понимание compliance.

Чем работа в Ростелекоме отличается от других telco?

Ростелеком — государственная компания с гигантской структурой и десятками ДО. По сравнению с приватными МТС/МегаФон/Билайн — больше corporate-процессов и compliance, длиннее циклы согласования. По сравнению с Tele2 (дочкой Ростелекома) — больше масштаба и разнообразия проектов.

Сколько собесов параллельно вести?

3-4 telco-компании или гос-компании в смежных сегментах. Если интересен B2C — Tele2, МегаФон, Билайн; если ШПД — Ростелеком, ЭР-Телеком; если гос-проекты — Ростелеком, ЦФТ, T1, ИБС.

Какие архитектурные кейсы стоит подготовить?

Churn для ШПД с географической спецификой, Wink-recsys для видео-сервиса, биометрия с ЕБС-compliance, гос-проект-аналитика, network forecast для магистрали.

Реально ли пройти на удалёнке?

Для B2C-аналитических ролей и Wink — возможно. Для гос-проектов и биометрии — обычно офис.

Какие книги и ресурсы дополнительно помогут?

Дополнительно к «Designing Data-Intensive Applications» — статьи по retail-DWH (для Wink), документация по 152-ФЗ и ЕБС, обзоры по B2C-telco в РФ. Также полезно посмотреть несколько публичных докладов руководителей Ростелеком-ИТ про data infrastructure гос-проектов.

Сколько готовиться к собесу в Ростелекоме?

В среднем 6-8 недель, если есть опыт в telco или B2C. Для гос-ролей — 8-12 недель из-за дополнительной СБ-подготовки.

Какие особенности нужно знать про Wink?

Wink — крупнейший российский видео-сервис, особенно сильный по подписочному контенту, спорту и live-каналам. Recsys в Wink имеет свою специфику: VOD vs live-каналы требуют разных моделей, важна работа с cold-start для новых сериалов и фильмов.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по ДО.