Собеседование на Data Scientist в ТТК

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему ТТК — особенный работодатель для DS

ТТК (ТрансТелеКом) — крупный российский telco-оператор, дочка РЖД: магистральная инфраструктура связи (десятки тысяч км оптоволокна вдоль ж/д путей), B2B-связь для крупного бизнеса и госструктур, B2C-интернет под брендом TTK. Для Data Scientist это специфический telco-контекст: фокус на B2B-сегмент (а не на массовый B2C, как Мегафон/Билайн), сетевая аналитика на магистральном уровне, интеграции с системами РЖД.

Главные ML-домены: сетевая аналитика (мониторинг качества магистральных каналов, прогноз нагрузки, оптимизация трафика); B2B-churn (корпоративные клиенты с длинными контрактами и более низким churn rate, но высоким average revenue per account); прогноз спроса на новые продукты; предиктивный сервис телеком-оборудования; антифрод; иногда — аналитика для систем РЖД (через материнскую компанию).

Стек: Python + Catboost + LightGBM + Prophet/statsmodels; Greenplum и ClickHouse для аналитики; Hadoop/Spark для тяжёлых сетевых данных; MLflow для трекинга; Airflow.

Актуальные вакансии — на hh.ru и сайте ТТК.

Информация основана на публичных источниках и опыте кандидатов. Команды ТТК используют разные процессы — формат и этапы зависят от направления, уточняйте у рекрутера.

Этапы собеседования

Полный цикл — 4-6 недель, 5-6 этапов. Процесс корпоративный: HR, ML-теория, кодинг и SQL, продуктовый кейс, поведенческое, финал.

1. HR-скрининг (30-45 минут)

Рекрутер уточняет: production-опыт ML (от 1.5-2 лет, желательно с telco или B2B-контекстом), знание стека, мотивацию идти в ТТК, ожидания по компенсации и формату (Москва, гибрид). Готовь питч на 90 секунд про самый зрелый production-кейс.

2. ML-теория (60-90 минут)

Базовая секция со старшим DS из команды. Темы: градиентный бустинг, классические методы, feature engineering для telco/network-данных, time-series, методы детекции аномалий. Специфический вопрос: «как ты бы построил модель прогноза нагрузки на магистральный канал с учётом сезонности (рабочее/выходные время) и event-driven спайков».

Подготовка: классическая ML, time series, feature engineering.

3. Python + SQL live coding (60 минут)

Задачи прагматичные: 1-2 на Python (pandas), 1-2 на SQL (оконки, JOIN). Часто живой кейс на network-данных или B2B-billing. Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.

Подготовка: live coding.

4. Продуктовый кейс (60-90 минут)

Кейс: «спроектируй pipeline прогноза нагрузки магистрального канала», «как ты бы построил churn-модель для B2B-клиентов с долгими контрактами», «как сделать предиктивный сервис телеком-оборудования». Нужно: уточнить требования, описать данные, выбрать модель, продумать пайплайн. Сильный сигнал — учёт B2B-специфики (мало клиентов, высокий ARPA, длинный sales-cycle).

Подготовка: ML system design.

5. Поведенческое + culture fit (45 минут)

С тимлидом или представителем направления. STAR-формат: конфликт с инженерами эксплуатации, факап, длинный проект.

6. Финал с руководителем (30 минут)

Грейд, оффер.

Особенности по командам

Network-аналитика. Команда работает с сетевыми данными: мониторинг качества магистральных каналов, прогноз нагрузки, оптимизация маршрутизации. Стек — Python + Spark + Hadoop + специализированные telco-системы. Подойдёт DS с инженерным или физико-математическим бэкграундом.

B2B-аналитика и churn. Команда строит модели для B2B-клиентов: churn-prediction, upsell, прогноз revenue по аккаунту. Стек — Catboost + Greenplum + дашборды. Челлендж — маленькая выборка (тысячи enterprise-клиентов, не миллионы). Подойдёт DS с B2B-аналитикой.

Predictive maintenance. Команда работает с предиктивным сервисом телеком-оборудования. Стек — Python + Catboost + autoencoders + интеграция с системами мониторинга. Подойдёт DS с инженерным мышлением.

Антифрод. Команда строит pipeline антифрода. Стек — Catboost + графовые методы. Подойдёт DS с background в антифроде.

Интеграции с РЖД. Уникальная для ТТК: данные на стыке telco и ж/д-инфраструктуры (мониторинг каналов вдоль путей, поддержка систем безопасности РЖД). Стек — Spark + специализированные системы. Подойдёт DS с интересом к индустриальной аналитике.

Что ТТК ценит в DS

B2B-контекст. Опыт в B2B-аналитике, банке или telco — большой плюс.

Telco / network-понимание. Знание основ telco-инфраструктуры (SDH, DWDM, MPLS, BGP) — мощный сигнал для network-команды.

Production-опыт. История про модель в проде с количественным эффектом на бизнес.

Weak vs strong на System Design. Слабый ответ: «возьмём GBM для прогноза нагрузки». Сильный ответ: «магистральный канал имеет несколько компонент: baseline (рабочее время, ARP-broadcast), event-driven спайки (бэкапы клиентов, видеостримы), долгий тренд (рост спроса). Декомпозиция через Prophet с custom holidays для бизнес-событий клиентов + Catboost на residuals. Метрика — не MAE, а доля корректных алертов на превышение SLA».

Готовность к корпоративной среде РЖД. ТТК — часть РЖД, регламентов много.

Self-management. Команды компактные.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 5-7 недель до планируемого собеса:

  1. Неделя 1-2 — Табличный ML и time-series. Catboost/LightGBM, Prophet, ARIMA, методы детекции аномалий. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день.
  2. Неделя 3 — Telco / B2B контекст. Прочитай блоги МТС Big Data, ТТК-новости, обзоры B2B-telco. Запомни понятия: SDH, DWDM, MPLS, ARPA, B2B-churn, SLA.
  3. Неделя 4 — Python + SQL live coding. 30-50 SQL Medium-Hard задач + 20 простых на pandas.
  4. Неделя 5 — System Design кейсы. Прорешай 5-6 кейсов: network load forecast, B2B churn, predictive maintenance, антифрод. ML system design.
  5. Неделя 6-7 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй.

Частые ошибки

Не понимают B2B-специфики. В ТТК B2B — это enterprise-клиенты с долгими контрактами. Кандидат, который рассказывает про массовый B2C-churn, теряет балл.

Хайпуют сложными моделями. На небольших B2B-выборках Catboost обычно проигрывает интерпретируемой логистической регрессии.

Игнорируют network-специфику. Network-данные требуют понимания telco-инфраструктуры.

Не задают вопросы про данные. На кейсе сразу — модель, а не «какие данные есть в OSS/BSS, какая частота, какие пропуски».

Не разбираются в B2B-метриках. «Что такое NRR в B2B-telco, ARPA?» — кандидат теряется.

Связанные темы

FAQ

Удалёнка в ТТК для DS?

Гибрид с офисом в Москве. Полная удалёнка возможна для отдельных позиций.

Зарплатные вилки 2026?

Middle DS: 220-340k. Senior: 340-540k. Lead — выше, особенно в network-направлениях.

Нужен ли английский?

Базовый — для документации telco-стандартов.

Сколько этапов?

5-6 этапов, 4-6 недель.

Реально ли пройти без telco-опыта?

Сложно для network-команд. B2B-аналитика и churn — доступнее для DS из банков или fintech.

Какие книги и ресурсы помогут подготовиться?

«Designing Data-Intensive Applications», статьи МТС Big Data, обзоры по telco. По SQL — задачник Карьерника.

Что подчеркнуть на финале?

Опыт работы с B2B-аналитикой, понимание telco-специфики, готовность к корпоративной среде РЖД-периметра.

Чем работа в ТТК отличается от других telco?

ТТК — государственный telco с магистральным фокусом и B2B-приоритетом. По сравнению с МТС/МегаФон/Билайн (массовый B2C-мобайл), в ТТК больше работы с magistral-сетями и enterprise-клиентами. По сравнению с Ростелекомом — более компактная компания, меньше бюрократии.

Сколько собесов параллельно вести?

3-4 telco-компании в смежных сегментах. Если интересна B2B — ТТК, Ростелеком, МТС B2B; если B2C — МТС, МегаФон, Билайн, Tele2. Параллельные собесы в близких сегментах помогают калибровать офферы.

Какие архитектурные кейсы стоит подготовить?

Network load forecast для магистрали, B2B churn с маленькой выборкой, predictive maintenance оборудования, антифрод, B2B-segmentation.

Реально ли пройти на удалёнке?

Для B2B-аналитических ролей — возможно. Для network-команд и проектов на стыке с РЖД — обычно офис.

Какие книги и ресурсы дополнительно помогут?

Дополнительно к «Designing Data-Intensive Applications» — обзоры по B2B-telco (Cisco, Juniper про SDH/MPLS), статьи по vehicle routing для операционных задач. Полезно посмотреть несколько докладов с конференций про network analytics в крупных корпорациях. Также — обзоры по аналитике железнодорожной инфраструктуры (через материнскую компанию РЖД).

Сколько готовиться к собесу в ТТК?

В среднем 6-8 недель, если есть опыт в telco или B2B-аналитике. Без profile-опыта — 8-10 недель, нужно доучить B2B-telco-словарь и понять специфику РЖД-периметра. Полезно за пару недель до собеса прочитать обзоры по магистральным сетям и MPLS — это сразу выравнивает ожидания.

Реально ли пройти с background из банков?

Реально на middle-позицию, особенно в B2B-аналитику. Банковский опыт в B2B-сегменте (corporate банкинг) хорошо переносится на B2B-telco — похожая модель LTV, длинные контракты, multi-touch sales cycle. Network-команды сложнее без telco-опыта.

Что подчеркнуть на финале в ТТК?

Опыт работы с B2B-аналитикой, понимание telco-инфраструктуры (SDH, MPLS, BGP), готовность к корпоративной среде РЖД-периметра. Истории про работу с network-операторами эксплуатации — большой плюс. Также ценится опыт работы с enterprise-клиентами на длинных контрактах и понимание customer lifecycle B2B-telco.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.