Собеседование на Data Scientist в ТТК
Содержание:
Почему ТТК — особенный работодатель для DS
ТТК (ТрансТелеКом) — крупный российский telco-оператор, дочка РЖД: магистральная инфраструктура связи (десятки тысяч км оптоволокна вдоль ж/д путей), B2B-связь для крупного бизнеса и госструктур, B2C-интернет под брендом TTK. Для Data Scientist это специфический telco-контекст: фокус на B2B-сегмент (а не на массовый B2C, как Мегафон/Билайн), сетевая аналитика на магистральном уровне, интеграции с системами РЖД.
Главные ML-домены: сетевая аналитика (мониторинг качества магистральных каналов, прогноз нагрузки, оптимизация трафика); B2B-churn (корпоративные клиенты с длинными контрактами и более низким churn rate, но высоким average revenue per account); прогноз спроса на новые продукты; предиктивный сервис телеком-оборудования; антифрод; иногда — аналитика для систем РЖД (через материнскую компанию).
Стек: Python + Catboost + LightGBM + Prophet/statsmodels; Greenplum и ClickHouse для аналитики; Hadoop/Spark для тяжёлых сетевых данных; MLflow для трекинга; Airflow.
Актуальные вакансии — на hh.ru и сайте ТТК.
Информация основана на публичных источниках и опыте кандидатов. Команды ТТК используют разные процессы — формат и этапы зависят от направления, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 4-6 недель, 5-6 этапов. Процесс корпоративный: HR, ML-теория, кодинг и SQL, продуктовый кейс, поведенческое, финал.
1. HR-скрининг (30-45 минут)
Рекрутер уточняет: production-опыт ML (от 1.5-2 лет, желательно с telco или B2B-контекстом), знание стека, мотивацию идти в ТТК, ожидания по компенсации и формату (Москва, гибрид). Готовь питч на 90 секунд про самый зрелый production-кейс.
2. ML-теория (60-90 минут)
Базовая секция со старшим DS из команды. Темы: градиентный бустинг, классические методы, feature engineering для telco/network-данных, time-series, методы детекции аномалий. Специфический вопрос: «как ты бы построил модель прогноза нагрузки на магистральный канал с учётом сезонности (рабочее/выходные время) и event-driven спайков».
Подготовка: классическая ML, time series, feature engineering.
3. Python + SQL live coding (60 минут)
Задачи прагматичные: 1-2 на Python (pandas), 1-2 на SQL (оконки, JOIN). Часто живой кейс на network-данных или B2B-billing. Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.
Подготовка: live coding.
4. Продуктовый кейс (60-90 минут)
Кейс: «спроектируй pipeline прогноза нагрузки магистрального канала», «как ты бы построил churn-модель для B2B-клиентов с долгими контрактами», «как сделать предиктивный сервис телеком-оборудования». Нужно: уточнить требования, описать данные, выбрать модель, продумать пайплайн. Сильный сигнал — учёт B2B-специфики (мало клиентов, высокий ARPA, длинный sales-cycle).
Подготовка: ML system design.
5. Поведенческое + culture fit (45 минут)
С тимлидом или представителем направления. STAR-формат: конфликт с инженерами эксплуатации, факап, длинный проект.
6. Финал с руководителем (30 минут)
Грейд, оффер.
Особенности по командам
Network-аналитика. Команда работает с сетевыми данными: мониторинг качества магистральных каналов, прогноз нагрузки, оптимизация маршрутизации. Стек — Python + Spark + Hadoop + специализированные telco-системы. Подойдёт DS с инженерным или физико-математическим бэкграундом.
B2B-аналитика и churn. Команда строит модели для B2B-клиентов: churn-prediction, upsell, прогноз revenue по аккаунту. Стек — Catboost + Greenplum + дашборды. Челлендж — маленькая выборка (тысячи enterprise-клиентов, не миллионы). Подойдёт DS с B2B-аналитикой.
Predictive maintenance. Команда работает с предиктивным сервисом телеком-оборудования. Стек — Python + Catboost + autoencoders + интеграция с системами мониторинга. Подойдёт DS с инженерным мышлением.
Антифрод. Команда строит pipeline антифрода. Стек — Catboost + графовые методы. Подойдёт DS с background в антифроде.
Интеграции с РЖД. Уникальная для ТТК: данные на стыке telco и ж/д-инфраструктуры (мониторинг каналов вдоль путей, поддержка систем безопасности РЖД). Стек — Spark + специализированные системы. Подойдёт DS с интересом к индустриальной аналитике.
Что ТТК ценит в DS
B2B-контекст. Опыт в B2B-аналитике, банке или telco — большой плюс.
Telco / network-понимание. Знание основ telco-инфраструктуры (SDH, DWDM, MPLS, BGP) — мощный сигнал для network-команды.
Production-опыт. История про модель в проде с количественным эффектом на бизнес.
Weak vs strong на System Design. Слабый ответ: «возьмём GBM для прогноза нагрузки». Сильный ответ: «магистральный канал имеет несколько компонент: baseline (рабочее время, ARP-broadcast), event-driven спайки (бэкапы клиентов, видеостримы), долгий тренд (рост спроса). Декомпозиция через Prophet с custom holidays для бизнес-событий клиентов + Catboost на residuals. Метрика — не MAE, а доля корректных алертов на превышение SLA».
Готовность к корпоративной среде РЖД. ТТК — часть РЖД, регламентов много.
Self-management. Команды компактные.
Как готовиться: план
За 5-7 недель до планируемого собеса:
- Неделя 1-2 — Табличный ML и time-series. Catboost/LightGBM, Prophet, ARIMA, методы детекции аномалий. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день.
- Неделя 3 — Telco / B2B контекст. Прочитай блоги МТС Big Data, ТТК-новости, обзоры B2B-telco. Запомни понятия: SDH, DWDM, MPLS, ARPA, B2B-churn, SLA.
- Неделя 4 — Python + SQL live coding. 30-50 SQL Medium-Hard задач + 20 простых на pandas.
- Неделя 5 — System Design кейсы. Прорешай 5-6 кейсов: network load forecast, B2B churn, predictive maintenance, антифрод. ML system design.
- Неделя 6-7 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй.
Частые ошибки
Не понимают B2B-специфики. В ТТК B2B — это enterprise-клиенты с долгими контрактами. Кандидат, который рассказывает про массовый B2C-churn, теряет балл.
Хайпуют сложными моделями. На небольших B2B-выборках Catboost обычно проигрывает интерпретируемой логистической регрессии.
Игнорируют network-специфику. Network-данные требуют понимания telco-инфраструктуры.
Не задают вопросы про данные. На кейсе сразу — модель, а не «какие данные есть в OSS/BSS, какая частота, какие пропуски».
Не разбираются в B2B-метриках. «Что такое NRR в B2B-telco, ARPA?» — кандидат теряется.
Связанные темы
- Собеседование на Data Scientist
- Feature engineering
- Time series на собесе
- Собеседование на Data Scientist в МТС
- Собеседование на Data Scientist в Tele2
FAQ
Удалёнка в ТТК для DS?
Гибрид с офисом в Москве. Полная удалёнка возможна для отдельных позиций.
Зарплатные вилки 2026?
Middle DS: 220-340k. Senior: 340-540k. Lead — выше, особенно в network-направлениях.
Нужен ли английский?
Базовый — для документации telco-стандартов.
Сколько этапов?
5-6 этапов, 4-6 недель.
Реально ли пройти без telco-опыта?
Сложно для network-команд. B2B-аналитика и churn — доступнее для DS из банков или fintech.
Какие книги и ресурсы помогут подготовиться?
«Designing Data-Intensive Applications», статьи МТС Big Data, обзоры по telco. По SQL — задачник Карьерника.
Что подчеркнуть на финале?
Опыт работы с B2B-аналитикой, понимание telco-специфики, готовность к корпоративной среде РЖД-периметра.
Чем работа в ТТК отличается от других telco?
ТТК — государственный telco с магистральным фокусом и B2B-приоритетом. По сравнению с МТС/МегаФон/Билайн (массовый B2C-мобайл), в ТТК больше работы с magistral-сетями и enterprise-клиентами. По сравнению с Ростелекомом — более компактная компания, меньше бюрократии.
Сколько собесов параллельно вести?
3-4 telco-компании в смежных сегментах. Если интересна B2B — ТТК, Ростелеком, МТС B2B; если B2C — МТС, МегаФон, Билайн, Tele2. Параллельные собесы в близких сегментах помогают калибровать офферы.
Какие архитектурные кейсы стоит подготовить?
Network load forecast для магистрали, B2B churn с маленькой выборкой, predictive maintenance оборудования, антифрод, B2B-segmentation.
Реально ли пройти на удалёнке?
Для B2B-аналитических ролей — возможно. Для network-команд и проектов на стыке с РЖД — обычно офис.
Какие книги и ресурсы дополнительно помогут?
Дополнительно к «Designing Data-Intensive Applications» — обзоры по B2B-telco (Cisco, Juniper про SDH/MPLS), статьи по vehicle routing для операционных задач. Полезно посмотреть несколько докладов с конференций про network analytics в крупных корпорациях. Также — обзоры по аналитике железнодорожной инфраструктуры (через материнскую компанию РЖД).
Сколько готовиться к собесу в ТТК?
В среднем 6-8 недель, если есть опыт в telco или B2B-аналитике. Без profile-опыта — 8-10 недель, нужно доучить B2B-telco-словарь и понять специфику РЖД-периметра. Полезно за пару недель до собеса прочитать обзоры по магистральным сетям и MPLS — это сразу выравнивает ожидания.
Реально ли пройти с background из банков?
Реально на middle-позицию, особенно в B2B-аналитику. Банковский опыт в B2B-сегменте (corporate банкинг) хорошо переносится на B2B-telco — похожая модель LTV, длинные контракты, multi-touch sales cycle. Network-команды сложнее без telco-опыта.
Что подчеркнуть на финале в ТТК?
Опыт работы с B2B-аналитикой, понимание telco-инфраструктуры (SDH, MPLS, BGP), готовность к корпоративной среде РЖД-периметра. Истории про работу с network-операторами эксплуатации — большой плюс. Также ценится опыт работы с enterprise-клиентами на длинных контрактах и понимание customer lifecycle B2B-telco.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.