Собеседование на Data Scientist в Playrix
Содержание:
Почему Playrix — особенный работодатель для DS
Playrix — один из крупнейших в мире разработчиков мобильных казуальных игр, авторы хитов Homescapes, Gardenscapes, Fishdom, Township. Совокупная база — сотни миллионов скачиваний и десятки миллионов активных игроков ежедневно по всему миру. Студия исторически известна сильной аналитикой и data-driven подходом: каждое изменение в игре — от размера кнопки до сложности уровня — проверяется A/B-тестом. Для Data Scientist это работа на одном из самых больших и зрелых mobile-F2P-продуктов мира с длинным циклом монетизации (LTV меряется месяцами и годами).
ML-домены: LTV-прогноз (как ранний predicted LTV в первые 1–7 дней, так и долгий 365-day LTV), churn / retention prediction на разных горизонтах (D1, D7, D30, D90), персонализация контента (какой ивент, какие level packs, какой оффер показать), уровневая сложность и DDA (dynamic difficulty adjustment) — модель, которая поддерживает оптимальный flow игрока, монетизация (uplift для специальных предложений, paywall-механики), сегментация для CRM-кампаний, антифрод и анти-чит. Стек: Python, scikit-learn, CatBoost, XGBoost, PyTorch, ClickHouse, Spark, Airflow, MLflow, внутренний A/B-фреймворк.
Актуальные вакансии — на hh.ru и сайте Playrix.
Информация основана на публичных источниках и опыте кандидатов. Команды Playrix используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл занимает 4–6 недель и включает 5–7 этапов. Playrix известен длинным и тщательным процессом: технических секций больше, чем в среднем по индустрии, плюс отдельный фокус на бизнес-кейсы.
1. HR-скрининг (30–45 минут)
Рекрутер проверяет фон: production-опыт DS (минимум 1.5–2 года), английский язык (часть процесса может идти на нём), причины смены работы, ожидания по компенсации, локация и готовность к relocation / удалёнке. Опыт работы с продуктовыми A/B-тестами на больших объёмах — критично. Готовь питч на 60–90 секунд: имя, основные модели в проде, эффект на бизнес-метрику с цифрами.
2. Тестовое задание (3–5 дней)
Practically всегда даётся домашка: датасет с игровыми событиями, нужно построить prediction-модель (часто LTV или D7-retention), описать процесс выбора признаков, валидацию и интерпретацию. Сдача — Jupyter Notebook + краткое сопроводительное письмо. Сильные кандидаты не просто гонят бустинг на всех фичах, а сначала исследуют данные, формируют гипотезы, обсуждают выбор метрики и обосновывают каждое решение.
3. ML / DS-теория (60–90 минут)
Глубокая секция со старшим DS. Темы: gradient boosting (CatBoost / XGBoost / LightGBM — разница), регуляризация и переобучение, calibration (isotonic / Platt) и зачем она нужна для LTV-модели, метрики качества классификации и регрессии, обработка пропусков и категориальных фич, причинно-следственный анализ (uplift / CATE), survival анализ для retention (Kaplan-Meier, Cox). Готовься выводить формулы log-loss, gini, объяснять trade-off между RMSE и MAE на конкретных продуктовых примерах.
Подготовка: Классическая ML на собесе, Метрики модели.
4. Python live coding + SQL (90 минут)
Live: 1–2 задачи на алгоритмы (LeetCode Medium), затем 2–3 задачи на pandas и SQL по игровым данным. Типичный пример SQL: «дан лог транзакций — посчитай N-day LTV в виде когортной кривой». Готовиться: LeetCode (минимум 60–80 задач), pandas chained operations, оконные функции SQL (RANK, LEAD/LAG, ROW_NUMBER), сложные GROUP BY с фильтрами.
Подготовка: Live-coding.
5. A/B-секция (60 минут)
Отдельная глубокая секция — Playrix очень сильно ставит на эксперименты. Спрашивают про: дизайн эксперимента (sample size, MDE, power, длительность), ratio-метрики и delta-method, multiple testing и FDR, peeking и sequential testing, SRM и его причины, switchback и его применимость в casual games (часто не работает из-за длинных сессий), CUPED для дисперсии-редукции, network effects (для социальных фич), как анализировать прирост LTV на коротком тесте, когда LTV меряется месяцами. Готовь 2–3 истории про реальный A/B в проде, лучше — с честно неудачным результатом, где ты объяснил почему.
Подготовка: A/B и causal inference.
6. Бизнес-кейс / ML system design (60–90 минут)
Кейс уровня «как ты бы построил систему предсказания LTV для нового продукта», «спроектируй персонализацию ивентов в Gardenscapes», «нужно увеличить retention на D30 — что измерим, что построим, как раскатим». От тебя ждут структурированный ответ: формулировка target, описание данных, baseline, итерации улучшения, A/B-план, мониторинг. Сильные кандидаты сразу обсуждают cost / value trade-off и риски.
7. Поведенческое (45–60 минут)
С тимлидом и менеджером. STAR-формат: расскажи про конфликт, факап, спор. Проверяют ownership, способность работать в кросс-функциональной команде и культурный fit. Часть секции может быть на английском.
Особенности по командам
Core Game Analytics (Gardenscapes / Homescapes / Fishdom). Каждая флагманская игра имеет свою команду DS, которая отвечает за весь цикл: retention, LTV, monetization, content personalization. Размер команды на одну игру — больше, чем целиком DS-отдел во многих средних компаниях. Подойдёт DS с любым background по A/B-экспериментам, но особенно сильно ценится опыт в casual-mobile-сегменте.
Live-ops & personalization. Отдельная горизонтальная команда: системы рекомендации ивентов, level packs, специальных предложений. Активно работает с recommender-подходами (collaborative filtering, contextual bandits) и uplift-моделями. Сюда часто берут DS с background в e-commerce / recsys.
Monetization & pricing. Глубокий ML в маркетинге и paywall: модели propensity-to-pay, optimal pricing для регионов, uplift для CRM-кампаний, attribution, MMM. Тесная связка с маркетинг-командой. Подойдёт DS с опытом в banking-scoring или маркетинг-аналитике большого e-commerce.
Difficulty & game balance. Команда отвечает за DDA — динамическое управление сложностью уровней, чтобы поддерживать flow. Использует онлайн-эксперименты и иногда контекстуальные bandits. Уникальная гейм-специфика: подойдёт DS, который сам играет в casual-mobile и понимает «почему уровень бесит».
Antifraud & integrity. Меньше команда: детекция аномалий в платежах, попытки эксплойта экономики, мульти-аккаунты. Mix классики (isolation forest, LightGBM) с графовыми сигналами.
Что Playrix ценит в DS
Бизнес-ориентированность. Слабый ответ: «модель показывает AUC 0.85». Сильный: «модель показывает AUC 0.85, в A/B на 20% трафика подняла D30-retention на +1.8pp и LTV-365 на +4%, что в год = $X дополнительной выручки на платформу». Цифры по бизнесу — обязательны.
Глубина в эксперименте. Объяснить дизайн, мощность, выбор метрик, что делать с null-результатом — must-have. Если ты не можешь рассчитать MDE на бумажке за 2 минуты, секция провалится.
Чистота кода. Ноутбук в тестовом задании читается как production-код: импорты сверху, ячейки в линейном порядке, нет «слепых» бустингов на всех фичах, есть проверка стабильности модели на отложенных периодах.
Английский. Минимум B2, для middle+ — С1. Письменный английский в notebook'е — отдельный сигнал, читается как qualified или non-qualified.
Скромность и любопытство. Студия не любит токсичных кандидатов. Если на собесе ты пробуешь объяснить «почему мой подход самый правильный», это минус. Если ты сначала уточняешь контекст у интервьюера, это плюс.
Как готовиться: план
Минимум 6–8 недель. Неделя 1–2: ML-теория (бустинги, регуляризация, метрики, calibration). Неделя 3: LeetCode Medium + pandas (50+ задач). Неделя 4: SQL — оконные функции, ratio-метрики, retention-формулы. Неделя 5: A/B-тесты — теория, common pitfalls, расчёт MDE. Неделя 6: ML system design — отработай 4–5 кейсов (LTV, churn, personalization, pricing, антифрод). Неделя 7: подготовь 3 STAR-истории про конфликт / факап / спор. Неделя 8: подтяни английский, mock-интервью с прямой обратной связью.
Для тренировки на реальных вопросах с собесов в DS — заходи в Карьерник: там 1500+ задач по SQL, Python, A/B-тестам, статистике и продуктовой аналитике, отсортированных по темам и сложности.
Частые ошибки
Самая частая ошибка кандидатов — слабое тестовое задание. Бустинг на всех фичах без feature engineering и без анализа важности — минус. Без честной cross-validation на отложенных периодах — минус. Без интерпретации результатов — минус. Лучше сдать модель чуть проще, но с чистым процессом и обоснованием каждого шага.
Вторая ошибка — нет A/B-кейсов с цифрами. На собесе вопрос «расскажи про самый успешный проект» — это вопрос про конкретный A/B-тест с метрикой и эффектом. Если ты говоришь «моя модель в проде» без цифр, интервьюер думает, что её там нет.
Третья — игнорирование long-term metrics. Casual-mobile живёт на LTV-365 и retention-D90. Если ты на собесе фокусируешься только на D1 и краткосрочной выручке, у тебя нет понимания продукта.
Четвёртая — слабый английский в notebook'е (тестовое). Корявые комментарии, machine-translated английский — минус. Лучше пиши на русском, чем плохо на английском.
Связанные темы
- Собеседование на Data Scientist в Pixonic
- Собеседование на ML Engineer в Playrix
- Собеседование на аналитика в Playrix
- Собеседование на Data Scientist — гайд
FAQ
Сколько этапов в собесе DS в Playrix?
5–7 этапов: HR-скрининг, тестовое задание (3–5 дней), ML-теория, Python live-coding + SQL, A/B-секция, бизнес-кейс / ML system design, поведенческое. Полный цикл занимает 4–6 недель.
Обязательно ли тестовое задание?
Да, почти всегда. Это центральный элемент процесса. Сильное тестовое задание может компенсировать слабую секцию, но плохое тестовое почти гарантирует отказ.
Какой английский нужен?
B2 минимум для middle, C1 для senior. Часть процесса может идти на английском, особенно если ты собеседуешься на международную команду или в Ireland HQ.
Принимают ли в РФ?
У студии есть удалённые контракты для специалистов из РФ через разные юридические схемы. Условия зависят от позиции и грейда — уточняй у рекрутера на скрининге.
Сколько платят DS в Playrix?
Зависит от грейда и локации. Для middle DS в РФ — на уровне топ-tech-компаний (Яндекс / Тинькофф), для senior — выше рыночного, особенно для удалённых контрактов в валюте.