Собеседование на Data Engineer в Tele2
Содержание:
Почему Tele2 — особенный работодатель для DE
Tele2 (с 2024 года T2 RU) — четвёртый федеральный мобильный оператор России, дочка Ростелекома: десятки миллионов абонентов, активный B2C-фокус, известная маркетинговая стратегия. Для Data Engineer это типичный telco-контекст с серьёзным масштабом: миллиарды CDR-записей в день (Call Detail Records), биллинг с минутной точностью, churn- и ARPU-pipeline для маркетинговой команды, антифрод real-time.
Главные DE-домены: биллинг-DWH (миллиарды CDR в день — звонки, SMS, дата-сессии, sms shortcodes); churn- и ARPU-pipeline для маркетинга; интеграция со стеком Ростелекома и собственными BSS/OSS Tele2; real-time антифрод pipeline (SIM-fraud, расход трафика); регуляторная отчётность ФСНТ и ЦБ (для финтех-продуктов Tele2); единая клиентская витрина.
Стек: Oracle и Teradata (наследие core-биллинга telco), Greenplum для DWH, ClickHouse для real-time; Kafka + Debezium для CDC; Airflow + dbt + Spark; Hadoop для тяжёлых CDR-данных. Команда плотно работает с маркетингом, антифрод и network-командами.
Актуальные вакансии — на hh.ru и сайте Tele2.
Информация основана на публичных источниках и опыте кандидатов. Команды Tele2 используют разные процессы — для compliance-ролей обязательна СБ, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 4-6 недель, 5-6 этапов. Процесс корпоративный: HR, техническое интервью, кодинг и SQL, архитектурный кейс, поведенческое, финал.
1. HR-скрининг (30-45 минут)
Рекрутер уточняет: production-опыт DE (от 2 лет, желательно с telco или big-data контекстом), знание стека, мотивацию идти в Tele2, ожидания по компенсации и формату (Москва, гибрид). Готовь питч на 90 секунд про самый зрелый production-pipeline.
2. Техническое интервью / SQL и архитектура (60-90 минут)
Базовая секция с senior DE из команды. Темы: SQL deep dive (оконки, оптимизация на больших таблицах биллинга, partitioning по времени), модели данных (звезда, снежинка для биллинга, journal-таблицы для CDR), batch vs streaming, CDC (Debezium), data quality. Специфический вопрос: «как ты бы построил CDR-pipeline на 5 миллиардов записей в день с гарантией exactly-once и reconciliation против биллинговой системы».
Подготовка: SQL для DE, Kafka streaming, Spark deep dive.
3. Python + SQL live coding (60-90 минут)
Задачи прагматичные: 1-2 на SQL (оконки, JOIN, оптимизация — часто на CDR-данных), 1-2 на Python (pandas, PySpark, простые ETL). Часто живой кейс на абонентских данных. Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.
Подготовка: SQL для DE.
4. Архитектурный кейс (90 минут)
Самая характерная секция. Кейс: «спроектируй CDR-pipeline для 30М абонентов с T+1 SLA для аналитики и T+минута для антифрода», «как ты бы построил churn-pipeline с интеграцией маркетинговой команды для retention-кампаний», «как сделать pipeline для биллинга роуминга с международными операторами». Нужно: уточнить требования, описать архитектуру, выбрать стек, продумать reconciliation, заложить compliance. Сильный сигнал — учёт telco-специфики (объёмы CDR, точность биллинга).
Подготовка: Airflow patterns, Monitoring и data quality.
5. Поведенческое + culture fit (45 минут)
С тимлидом или представителем направления. STAR-формат: конфликт с маркетинговой командой, факап в проде CDR-pipeline, длинный compliance-проект.
6. Финал с руководителем (30 минут)
Грейд, оффер.
Особенности по командам
Биллинг-DWH и CDR. Команда работает с биллингом и CDR-данными: ingest миллиардов событий в день, агрегация для биллинга и аналитики. Стек — Oracle/Teradata + Greenplum + Kafka + Spark + Hadoop. Челлендж — масштаб, точность биллинга (каждая секунда трафика должна сходиться), регуляторные требования. Подойдёт DE с big-data telco опытом.
Churn и retention pipeline. Команда строит pipeline для churn-модели и retention-кампаний. Стек — Greenplum + ClickHouse + Airflow + интеграция с CRM. Подойдёт DE с продуктовой или CRM-аналитикой.
Real-time антифрод. Команда строит real-time pipeline антифрода: события трафика → детекция аномалий → решение блокировки. Стек — Kafka + ClickHouse + кастомные стриминговые сервисы. Подойдёт DE с background в стримах.
Network DE. Команда работает с network-аналитикой: ingest данных от базовых станций, прогноз нагрузки, маршрутизация. Стек — Hadoop + Spark + специализированные telco-системы. Подойдёт DE с инженерным бэкграундом.
Compliance и регуляторика. Команда занимается регуляторной отчётностью (ФСНТ, ЦБ для финтех-продуктов). Стек — Greenplum + Airflow + dbt. Подойдёт DE с regulatory-опытом.
Что Tele2 ценит в DE
Production-опыт на масштабе. История про pipeline в проде на миллиардах CDR в день. «Запустил CDR-pipeline на 5B событий в день с T+1 SLA и 99.99% точностью биллинга» — это история.
Telco-контекст. Опыт в МТС, МегаФон, Билайн, Ростелеком — большой плюс.
Точность биллинга. В telco каждая копейка должна сходиться. Кандидат, который не упоминает reconciliation — теряет балл.
Weak vs strong на архитектурном кейсе. Слабый ответ: «возьмём Kafka + ClickHouse для CDR-pipeline». Сильный ответ: «CDR на 5B событий в день — это в среднем 60K TPS с пиками до 200K. Архитектура: CDR-генератор → Kafka с partition по subscriber_id range → consumer пишет в Hadoop (исторический lake, raw) + ClickHouse (агрегаты для аналитики) + Oracle/Teradata (биллинг, agreed для финансов). Reconciliation против биллинговой системы daily с алертами на расхождение более 0.0001%. Для аналитики — отдельный layer в Greenplum через batch ETL из Hadoop. Real-time антифрод — отдельный stream с TTL 1 час».
Готовность к корпоративной среде. Tele2 — часть Ростелекома, регламентов хватает.
Self-management. Команды компактные.
Как готовиться: план
За 6-8 недель до планируемого собеса:
- Неделя 1-2 — SQL deep dive и big-data. SQL Medium-Hard 30+ задач, Hadoop, Spark deep dive. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день.
- Неделя 3 — Стрим и telco-стек. Kafka, Debezium, ClickHouse, обзоры по CDR/BSS/OSS.
- Неделя 4 — Telco контекст. Прочитай блоги МТС Big Data, обзоры по telco-DWH. Запомни понятия: CDR, BSS/OSS, ARPU, churn, billing reconciliation, mediation.
- Неделя 5 — Архитектурные кейсы. Прорешай 5-6 кейсов: CDR-pipeline миллиардов событий, churn-pipeline, real-time антифрод, billing reconciliation, регуляторная отчётность. Airflow patterns.
- Неделя 6-8 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй.
Частые ошибки
Игнорируют объёмы CDR. Telco-CDR — это десятки миллиардов событий в день. Кандидат, который проектирует «как для e-com на 100K событий», теряет балл.
Не разбираются в telco-метриках. «Что такое CDR, BSS/OSS, mediation?» — кандидат теряется.
Игнорируют точность биллинга. В telco расхождение копейки = претензия от финансов и регулятора.
Хайпуют streaming для всего. Для регуляторной отчётности важна не скорость, а консистентность.
Не задают вопросы про объёмы и SLA. На кейсе сразу — стек, а не «сколько CDR в секунду, какие SLA, какой retention». Это первый фильтр.
Связанные темы
- Собеседование на Data Engineer
- Kafka streaming
- Spark deep dive
- Собеседование на Data Engineer в МТС
- Собеседование на Data Scientist в Tele2
FAQ
Удалёнка в Tele2 для DE?
Гибрид с офисом в Москве. Полная удалёнка возможна для отдельных позиций.
Зарплатные вилки 2026?
Middle DE: 250-380k. Senior: 380-600k. Lead — выше, особенно в core-биллинге и real-time.
Нужен ли английский?
Базовый — для документации telco-стандартов.
Сколько этапов?
5-6 этапов, 4-6 недель.
Реально ли пройти без telco-опыта?
Сложно для core-billing команд. Marketing-pipeline и продуктовые витрины — доступнее.
Какие книги и ресурсы помогут подготовиться?
«Designing Data-Intensive Applications», статьи МТС Big Data, обзоры по telco-DWH. По SQL — задачник Карьерника.
Что подчеркнуть на финале?
Опыт работы с big-data на масштабе, понимание telco-биллинга и reconciliation, готовность к корпоративной среде Ростелеком-периметра.
Чем работа в Tele2 отличается от других telco?
Tele2 — четвёртый федеральный оператор с продуктовой культурой. По сравнению с МТС/МегаФон (где больше масштаба и регуляторики) — быстрее принимает решения. По сравнению с Билайном — меньше legacy. Tele2 исторически делает ставку на data-driven маркетинг, что даёт DE-команде интересные задачи на стыке с продуктом и маркетингом.
Сколько собесов параллельно вести?
3-4 telco-компании одновременно (Tele2, МТС, МегаФон, Билайн, Yota). Параллельные собесы в близких сегментах помогают калибровать офферы — telco-словарь общий.
Какие архитектурные кейсы стоит подготовить?
CDR-pipeline на миллиарды событий с reconciliation против биллинга, churn-pipeline с интеграцией маркетинговой команды, real-time антифрод, регуляторная отчётность ЦБ/ФСНТ, unified customer view с интеграцией со стеком Ростелекома.
Сколько готовиться к собесу в Tele2?
В среднем 6-8 недель, если есть опыт в telco или big-data. Без profile-опыта — 8-10 недель, нужно доучить telco-стек (BSS/OSS, CDR, mediation). Полезно прочитать обзоры по архитектуре MNO/MVNO в Российской Федерации — это сразу выравнивает мышление.
Какие книги и ресурсы дополнительно помогут?
Дополнительно к «Designing Data-Intensive Applications» — статьи по mediation в telco, документация TM Forum (eTOM, SID), обзоры по большим CDR-pipeline в крупных операторах.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.