Собеседование на Data Scientist в Yota
Содержание:
Почему Yota — особенный работодатель для DS
Yota — мобильный оператор, входящий в группу МегаФон с уникальным позиционированием: молодёжная аудитория, гибкие тарифы (включая «Безлимитный интернет на любые приложения» в исторической версии), активный B2C-фокус. Технологически Yota работает на инфраструктуре МегаФона как MVNO с собственными биллингом, маркетингом и продуктовой командой. Для Data Scientist это специфический контекст: классические telco-задачи (churn, ARPU) плюс особенности MVNO-модели (зависимость от network-провайдера, но собственная продуктовая монетизация).
Главные ML-домены: churn-prediction (молодёжная аудитория с высоким churn rate), ARPU-моделирование с учётом гибких тарифов, маркетинговая сегментация и persona-recommendation, прогноз спроса на новые тарифные планы, антифрод (особенно SIM-related), product-аналитика приложения Yota. Часть проектов завязана на network-данные от МегаФона.
Стек: Python + Catboost + LightGBM + scikit-learn + Prophet; Greenplum и ClickHouse для аналитики; MLflow для трекинга; интеграция с network-стеком МегаФона. Команда компактная, плотная коммуникация с маркетингом и продуктом.
Актуальные вакансии — на hh.ru и сайте Yota.
Информация основана на публичных источниках и опыте кандидатов. Команды Yota используют разные процессы — формат и этапы зависят от направления, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 3-5 недель, 4-5 этапов. Процесс прагматичный: HR, ML-теория, кодинг и SQL, продуктовый кейс, финал.
1. HR-скрининг (30 минут)
Рекрутер уточняет: production-опыт ML (от 1.5-2 лет, желательно с B2C-аналитикой), знание стека, мотивацию идти в Yota, ожидания по компенсации и формату (Москва, гибрид). Готовь питч на 90 секунд про самый зрелый production-кейс.
2. ML-теория (60-90 минут)
Базовая секция со старшим DS. Темы: градиентный бустинг, классические методы, feature engineering для telco-данных, time-series, базовая статистика для A/B. Специфический вопрос: «как ты бы построил churn-модель для молодой аудитории Yota с учётом, что они чувствительны к социальным трендам и promo».
Подготовка: классическая ML, feature engineering, метрики модели.
3. Python + SQL live coding (60 минут)
Задачи прагматичные: 1-2 на Python (pandas), 1-2 на SQL (оконки, JOIN). Часто живой кейс на абонентских данных. Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.
Подготовка: live coding.
4. Продуктовый кейс (60-90 минут)
Кейс: «спроектируй churn-pipeline для Yota с учётом молодёжной специфики», «как ты бы построил A/B-инфраструктуру для тестирования новых тарифов», «как сделать persona-recommendation для оптимального тарифа клиенту». Нужно: уточнить требования, описать данные, выбрать модель. Сильный сигнал — учёт молодёжной аудитории Yota и MVNO-специфики (зависимость от network-инфраструктуры МегаФона).
Подготовка: ML system design.
5. Финал с тимлидом / руководителем (45 минут)
Беседа с тимлидом, грейд, оффер.
Особенности по командам
Churn и retention DS. Команда строит churn-модели и retention-инструменты. Стек — Catboost + Greenplum + ClickHouse + интеграция с CRM. Челлендж — молодёжная аудитория с высоким churn и чувствительностью к social factors. Подойдёт DS с B2C-аналитикой.
Marketing DS. Команда работает с маркетинг-аналитикой: сегментация, persona-recommendation, A/B-тестирование тарифов. Стек — Catboost + ClickHouse + кастомные A/B-инструменты. Подойдёт DS с marketing analytics или recsys-фоном.
Product analytics. Команда занимается продуктовой аналитикой приложения Yota: события, конверсии, retention в приложении. Стек — Catboost + Amplitude/Mixpanel-аналоги + ClickHouse. Подойдёт DS с product analytics-фоном.
Антифрод. Команда строит pipeline антифрода: SIM-related фрод, manipulation с тарифами. Стек — Catboost + графовые методы. Подойдёт DS с антифрод-background.
Network-related аналитика. Команда работает на стыке с МегаФон-network: качество связи у абонентов Yota, прогноз качества сервиса. Стек — Spark + специализированные telco-системы. Подойдёт DS с инженерным бэкграундом.
Что Yota ценит в DS
B2C / telco / молодёжный контекст. Опыт в B2C, banking, ритейле, particularly с молодёжной аудиторией — большой плюс.
Production-опыт. История про модель в проде.
Скорость пилота. Yota — продуктовая команда внутри МегаФона, темп быстрый.
Weak vs strong на System Design. Слабый ответ: «возьмём GBM для churn в Yota». Сильный ответ: «Yota — молодёжная аудитория, high churn rate (12-15% месяц), чувствительность к promo и social factors. Архитектура: Catboost с фичами behavioral (usage patterns, app activity, social media-derived если есть) + market intelligence (когда у конкурента появляется агрессивное promo). Treatment-стратегия — gamified retention через приложение (молодёжь не реагирует на classic SMS-promo). Метрика — revenue saved в когортном A/B с учётом short payback period (молодёжь быстро уходит за лучшим offer)».
Готовность к продуктовому темпу. Yota — продуктовая команда.
Self-management. Команды компактные.
Как готовиться: план
За 4-6 недель до планируемого собеса:
- Неделя 1-2 — Табличный ML и A/B. Catboost/LightGBM, A/B-тесты (sequential testing, FDR), churn-моделирование. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день.
- Неделя 3 — Telco и B2C-контекст. Прочитай блоги МТС Big Data, ВымпелКом, обзоры по молодёжному B2C-маркетингу. Запомни понятия: ARPU, churn, MVNO, persona-recommendation, gamified retention.
- Неделя 4 — Python + SQL live coding. 30-50 SQL Medium-Hard задач + 20 простых на pandas.
- Неделя 5 — System Design кейсы. Прорешай 5-6 кейсов: churn молодёжной аудитории, A/B-инфраструктура для тарифов, persona-recommendation, product analytics приложения, антифрод. ML system design.
- Неделя 6 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй.
Частые ошибки
Игнорируют молодёжную аудиторию. В Yota churn-стратегии другие, чем у consumer-base. SMS-promo не работают, нужны gamified подходы.
Не разбираются в MVNO-специфике. Yota — MVNO на сети МегаФона. Кандидат, который этого не понимает, теряет балл.
Хайпуют сложными моделями. На telco-табличке Catboost обычно выигрывает.
Не задают вопросы про данные. На кейсе сразу — модель, а не «какие данные есть, какая частота, какие пропуски».
Не учитывают social factors. Для молодёжной аудитории social media-derived фичи могут давать ощутимый прирост качества модели.
Связанные темы
- Собеседование на Data Scientist
- Feature engineering
- A/B и causal
- Собеседование на Data Scientist в МегаФоне
- Собеседование на Data Scientist в Tele2
FAQ
Удалёнка в Yota для DS?
Гибрид с офисом в Москве. Полная удалёнка возможна для отдельных позиций.
Зарплатные вилки 2026?
Middle DS: 220-340k. Senior: 340-540k. Lead — выше.
Нужен ли английский?
Базовый — для документации.
Сколько этапов?
4-5 этапов, 3-5 недель.
Реально ли пройти без telco-опыта?
Реально на middle-позицию, если есть опыт с B2C-аналитикой или продуктовой аналитикой mobile-приложений.
Какие книги и ресурсы помогут подготовиться?
«Designing Data-Intensive Applications», статьи Mixpanel/Amplitude про product analytics, обзоры по молодёжному B2C-маркетингу. По SQL — задачник Карьерника.
Что подчеркнуть на финале?
Опыт работы с B2C/product-аналитикой, понимание молодёжной аудитории и MVNO-модели, готовность к быстрому продуктовому темпу. Истории про A/B-тестирование продуктовых фич или работу с retention в mobile-приложениях — серьёзный плюс.
Чем работа в Yota отличается от других telco?
Yota — продуктовая команда внутри МегаФона, ориентированная на молодёжь и unique-tariffs. По сравнению с МТС/МегаФон/Билайн (массовый B2C с консервативным маркетингом) — более продуктовая, быстрее экспериментирует. По сравнению с Tele2 — внутри материнского МегаФона, меньше самостоятельности по network-решениям, но больше свободы в продуктовом маркетинге.
Сколько собесов параллельно вести?
3-4 telco-компании в B2C-сегменте (Yota, Tele2, МТС, МегаФон). Также рационально параллельно собеседоваться в продуктовые компании с молодёжной аудиторией (Wildberries, Avito, Яндекс.Маркет).
Какие архитектурные кейсы стоит подготовить?
Churn для молодёжной аудитории с social factors, A/B-инфраструктура для тарифов, persona-recommendation, product analytics приложения, антифрод SIM-related.
Реально ли пройти на удалёнке?
Возможно для product- и marketing-аналитических ролей. Для антифрод-команд и проектов на стыке с network МегаФона — обычно офис или гибрид.
Какие книги и ресурсы дополнительно помогут?
Дополнительно к «Designing Data-Intensive Applications» — статьи Mixpanel/Amplitude про product analytics, обзоры по молодёжному B2C-маркетингу (TikTok-маркетинг, gamification в retention). Полезно посмотреть статьи о Duolingo, Spotify, Discord — гигантов с молодёжной аудиторией и сильной retention-аналитикой.
Сколько готовиться к собесу в Yota?
В среднем 5-7 недель, если есть опыт в B2C или product analytics. Без profile-опыта — 7-9 недель, нужно доучить telco-специфику и MVNO-модель. Полезно поработать с публичными mobile-датасетами (Kaggle telco churn) и попробовать построить churn-модель — это сразу выравнивает мышление.
Что отличает Yota от Tele2?
Yota — продукт внутри МегаФона, ориентация на молодёжь и unique тарифы. Tele2 — самостоятельный федеральный оператор (часть Ростелекома), массовый B2C. В Yota темп быстрее за счёт продуктового фокуса, в Tele2 — больше масштаба и инфраструктурной автономии. Если хочешь работать с молодёжной аудиторией и быстрыми продуктовыми пилотами — Yota. Если с большим масштабом и автономией — Tele2.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.