Собеседование на Data Scientist в Pixonic

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Pixonic — особенный работодатель для DS

Pixonic — крупная мобильная игровая студия, разработчик хита War Robots (PvP-боевых роботов на мобильных) и других F2P-проектов. Студия входит в холдинг Astrum Entertainment (бывшее My.Games). War Robots — один из самых длинных по жизненному циклу mid-core mobile PvP-проектов: десятки миллионов скачиваний, активные ежедневные сессии и серьёзная инфраструктура поддержки матчей и монетизации. Для Data Scientist это работа с продуктом, где одновременно решаются задачи матчмейкинга, retention, монетизации, антифрода и аналитики ивентов — и каждое решение измеряется через A/B-тест на миллионах игроков.

ML-домены: матчмейкинг (баланс PvP-боёв с учётом mech-loadout и навыков), churn / retention prediction (D1/D7/D30, реактивация спящих), монетизация (uplift-модели для оффера battle-pass, propensity-to-pay), recommendation в магазине (какие mech-юниты и апгрейды показать конкретному игроку), антифрод (детекция aim-bot, накруток, эксплойтов), сегментация и LTV-прогноз для CRM-кампаний. Стек: Python (pandas/polars), scikit-learn, CatBoost, PyTorch — для нейросетевых задач, ClickHouse — для аналитики игровых событий, Spark — для тяжёлых ETL, MLflow — для трекинга экспериментов, Airflow — для пайплайнов.

Актуальные вакансии — на hh.ru и сайте Pixonic.

Информация основана на публичных источниках и опыте кандидатов. Команды Pixonic используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

Цикл собеса обычно занимает 3–5 недель и включает 5–6 этапов. По сравнению с банковскими процессами здесь меньше формальной алгоритмической секции, но сильнее упор на продуктовую интуицию, A/B-эксперименты и понимание игровой механики.

1. HR-скрининг (30–45 минут)

Рекрутер проверяет базу: production-опыт DS / ML (1+ год работы с реальным трафиком, не только Kaggle), причины ухода с прошлой работы, мотивацию именно к Pixonic, ожидания по грейду и компенсации. Если у тебя есть опыт в mobile gaming, F2P-монетизации или e-commerce-рекомендациях — упомяни в первые 30 секунд, это сильно ускоряет процесс. Подготовь питч на 90 секунд: что делал, какие модели в проде, какой эффект на бизнес-метрику.

2. ML / DS-теория (60–90 минут)

Базовая секция с ведущим DS из команды. Темы, которые встречаются регулярно: градиентный бустинг (как работает CatBoost, почему именно он, обработка категориальных фич), классическая классификация и регрессия (метрики, переобучение, регуляризация), оценка моделей в продакшене (calibration, drift), uplift-модели для маркетинга (S-learner / T-learner / X-learner — разница и когда применять), survival-анализ для retention (Kaplan-Meier, Cox), сегментация юзеров (k-means / GMM vs бизнес-правила). Будь готов рассказать про bias-variance trade-off на конкретных примерах из работы.

Подготовка: Классическая ML на собесе, ML-теория.

3. Python live coding (60–90 минут)

Live-кодинг с экраном: одна-две задачи уровня LeetCode Medium на алгоритмы и структуры данных, плюс задача на pandas / SQL по игровым данным. Типичный пример: «дан DataFrame с событиями event_id, user_id, event_type, timestamp — посчитай D7-retention по когортам по дате регистрации». Готовиться по LeetCode (минимум 80 решённых задач за 3–4 недели до собеса) и тренироваться на быстрых pandas-задачках.

Подготовка: Live-coding.

4. A/B и эксперименты (60 минут)

Отдельная секция — Pixonic много экспериментирует на live-аудитории. Спрашивают: дизайн эксперимента (sample size, MDE, power), что делать с SRM, как анализировать ratio-метрики (CTR, ARPPU), peeking и sequential testing, switchback (когда применим в games), интерпретация неудачного теста («метрика просела в одном сегменте — это плохо?»), длительность теста при сильной cyclicality по дням недели. Готовь 1–2 истории про реальный A/B в проде: что тестировал, что получилось, что не сошлось с гипотезой.

Подготовка: A/B и causal inference.

5. ML system design / продуктовая секция (90 минут)

Самая длинная и характерная секция. Кейсы вида: «спроектируй систему матчмейкинга для War Robots», «как ты бы построил churn prediction для D30», «придумай ML-feature для нового live ивента». От тебя ждут: формулировку бизнес-метрики и оптимизируемого target, выбор архитектуры (двухэтапная: retrieval → ranking; vs одна модель), feature engineering (offline + online, особенно временные фичи поведения игрока), план обучения и evaluation, A/B-план с метриками, мониторинг и план отката. Сильные ответы — где видна забота про latency, train-serving skew, cold start для новых юзеров.

Подготовка: ML system design.

6. Поведенческое + культурный fit (45 минут)

С тимлидом и/или продуктовым менеджером. STAR-формат: расскажи про конфликт с продактом, про факап с моделью в проде, про спор по архитектуре. Проверяют ownership, готовность копать вглубь и адекватность с коллегами. Если факапов в прод не было — рассказывай учебный, но честно.

Особенности по командам

Game balance & matchmaking. Главная команда по PvP-механикам: матчмейкинг, баланс mech-юнитов, расчёт TrueSkill / Elo-вариантов с поправкой на состав боя, антифрод-сигналы. Модели влияют на каждый матч в проде. Стек — классический ML на табличных данных (CatBoost / LightGBM), кастомные алгоритмы матчмейкинга на Python и Go. Сюда идут DS с опытом ranking / recommender systems в e-commerce или с серьёзным опытом в gaming.

Monetization & CRM. Команда отвечает за выручку: uplift-модели для оффера battle-pass и paywall, propensity-to-pay сегментация, динамическое ценообразование IAP, LTV-прогноз. Тесные коммуникации с продуктовыми менеджерами и маркетинг-аналитиками. Стек — CatBoost, MMM-подходы для маркетинга, A/B-инфраструктура. Подойдёт DS с background в банковском скоринге или маркетинговой аналитике e-commerce.

Retention & live-ops. Анализ удержания, прогноз churn, реактивация спящих игроков, тюнинг сложности (DDA — dynamic difficulty adjustment), ML для персонализации квестов и ивентов. Команда работает в плотной связке с гейм-дизайнерами. Подойдёт DS, который любит продукт и готов погружаться в игровую механику.

Antifraud & integrity. Детекция читов (aim-bot, wall-hack), накруток статистики, мульти-аккаунтов, эксплойтов экономики. Mix классического ML и графовых подходов (поиск аномалий, сетевые сигналы между аккаунтами). Сюда чаще берут DS с background в anti-fraud в финтехе.

User analytics & insights. Менее модельная команда — больше аналитики и продуктовых разрезов, но работа с ML-метриками и сегментацией всё равно есть. Это «entry-level» в продукте, через который потом переходят в monetization или retention-команды.

Что Pixonic ценит в DS

Продуктовое мышление. Не «обучил модель и сдал», а «понял задачу — выбрал метрику — сравнил с baseline — выкатил в A/B — измерил эффект». На собесе это проверяется в каждой секции.

Опыт A/B-экспериментов. Готовь конкретные кейсы из прода с цифрами. Weak: «обучил модель, она показала AUC 0.78». Strong: «обучил модель, в A/B на 30% трафика за 14 дней получили +3.5% ARPDAU и +1.2pp D7-retention, p < 0.01, после раскатки эффект сохранился». Числа решают.

Понимание gaming-специфики. Cyclicality по дням недели и event-календарю, сильная heterogeneity по странам и сегментам, важность LTV vs краткосрочной выручки, баланс PvE / PvP контента. Если ты не играл — хотя бы установи War Robots на пару вечеров перед собесом.

Production-ориентированность. Что будет с моделью через 3 месяца после раскатки — drift, retraining, monitoring. Сильные кандидаты сами поднимают эти темы.

Командная адекватность. Студия не любит токсичных «один-в-поле-воин» DS. Готовность работать с гейм-дизайнерами, продактами и аналитиками — обязательна.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

Минимум 4–6 недель на подготовку. Неделя 1–2: освежить ML-теорию (gradient boosting, регуляризация, метрики), пройти LeetCode Medium на алгоритмы (80+ задач). Неделя 3: A/B-тесты — теория, ratio-метрики, common pitfalls. Подготовь 2–3 истории из своего опыта по STAR. Неделя 4: ML system design — поработай руками над 3–4 типичными кейсами (recommender, churn, fraud). Неделя 5: gaming-специфика — почитай статьи про матчмейкинг (TrueSkill, OpenSkill), про uplift-моделирование, поиграй пару дней в War Robots, чтобы говорить с product owner на одном языке. Неделя 6: mock-интервью + повторение слабых мест.

Для тренировки вопросов с реальных собесов по DS — бери Карьерник, там 1500+ задач по SQL, Python, статистике, A/B и ML, разбитых по темам и сложности.

Частые ошибки

Кандидаты заваливаются на трёх типичных моментах. Первый — отсутствие конкретики в кейсах: «я работал над churn-моделью» без цифр и без описания A/B-валидации читается как «не работал». Второй — игнорирование gaming-специфики: на ML system design кандидат предлагает рецепт из e-commerce («возьмём two-tower-модель») без учёта того, что в War Robots поведение игроков сильно зависит от события и состава команды. Третий — слабый английский в техническом обсуждении: часть лидов и сениоров — носители английского, проверяй, что можешь свободно объяснить идею модели в 30 секундах. И, отдельно: не путай Data Scientist с ML Engineer — в Pixonic это разные грейды и треки, на DS-собесе спрашивают про эксперименты и продуктовую интуицию, а не про deployment на K8s.

Связанные темы

FAQ

Сколько этапов в собесе DS в Pixonic?

5–6 этапов: HR-скрининг, ML-теория, Python live-coding, A/B и эксперименты, ML system design, поведенческое. Цикл занимает 3–5 недель.

Спрашивают ли алгоритмы LeetCode уровня Hard?

В основном Medium. Hard встречается редко, и почти всегда это или модификация под ML / pandas, или для senior-позиций. Готовься плотно к Medium.

Нужен ли опыт именно в gaming, чтобы пройти?

Не обязательно. Но опыт в продуктовом DS с A/B-экспериментами на больших объёмах трафика (e-commerce, финтех, marketplace) сильно помогает. Если опыта в games нет — установи игру и почитай продуктовый блог Pixonic / My.Games.

Какой английский нужен?

B2 минимум. Для senior-позиций — C1. Часть документации и часть команды используют английский, особенно если ты работаешь с международными подразделениями Astrum.

Платят ли в долларах / евро?

Зависит от позиции и юрлица контракта. В РФ-контракте — рубли, грейды на уровне крупных tech-компаний (Яндекс / Тинькофф). Удалённые контракты бывают в валюте — уточняй у рекрутера на скрининге.