Собеседование на Data Scientist в MY.GAMES

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему MY.GAMES — особенный работодатель для DS

MY.GAMES — крупный игровой холдинг с международным продуктовым портфелем, исторически в составе VK / Mail.ru group, позднее переименован и реструктурирован в Astrum Entertainment с VK Play как RU-сегментом. Портфель — десятки игр: PC-проекты (Warface), mobile-хиты (Hustle Castle, War Robots — через Pixonic), web-игры, издательство сторонних проектов. Совокупная аудитория — десятки миллионов активных игроков в месяц. Для Data Scientist это работа в одном из самых разнообразных gaming-портфелей в РФ: можно встретить и mobile-F2P, и PC-shooter, и web-игры, причём задачи DS пересекаются — UA / монетизация / retention строятся на общих фреймворках.

ML-домены: retention prediction (на разных горизонтах для разных жанров), churn-classification и реактивация, LTV-прогноз для маркетинга и UA, антифрод (особенно в PC-shooter-сегменте — anti-cheat ML), uplift для CRM-кампаний, recommendation для VK Play (какие игры показать игроку), сегментация аудитории, маркетинговая атрибуция (MMM) для крупных бюджетов на user acquisition. Стек: Python, CatBoost / XGBoost, PyTorch для отдельных задач (anti-cheat, NLP в чатах), ClickHouse и Vertica для аналитики, Spark для тяжёлых ETL, Airflow, MLflow, внутренняя A/B-инфраструктура.

Актуальные вакансии — на hh.ru и сайте MY.GAMES / VK Play.

Информация основана на публичных источниках и опыте кандидатов. Команды MY.GAMES используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

Цикл занимает 3–5 недель и включает 5–6 этапов. Процесс ближе к структурированному корпоративному — компания крупная, в каждом блоке свои стандарты. Часть этапов может проходить онлайн с командами в разных локациях.

1. HR-скрининг (30–45 минут)

Рекрутер проверяет: production-опыт DS (минимум 1.5 года), интерес к gaming, ожидания, локацию. Многие игры портфеля делаются распределёнными командами — готовность к удалённой работе или гибридному графику важна. Питч 60–90 секунд: имя, основные проекты, эффект на бизнес-метрику.

2. Тестовое задание (3–5 дней) — опционально

Часть команд даёт тестовое (особенно UA / marketing-DS), часть — нет (особенно где роль ближе к продуктовой аналитике). Если получаешь тестовое — обычно это retention или LTV на симулированных или анонимизированных игровых данных. Сдача — Jupyter Notebook с интерпретацией.

3. ML / DS-теория (60–90 минут)

С senior DS / тимлидом. Темы: классическая ML (бустинги, регуляризация, метрики), uplift-моделирование (актуально для CRM), survival-анализ, маркетинговая атрибуция (last-click, data-driven, MMM-подходы), статистика (статтесты, доверительные интервалы, ratio-метрики). Готовь объяснение, почему именно тот алгоритм / метрика выбраны под задачу.

Подготовка: Классическая ML на собесе, ML-теория.

4. Python live coding (60–90 минут)

Live: 1–2 алгоритмических задачи (LeetCode Medium), 1–2 на pandas / SQL на игровых данных. SQL обычно классический: оконные функции, GROUP BY с фильтрами, ratio-метрики. Готовиться плотно к LeetCode (60+ задач) и оконкам.

Подготовка: Live-coding, SQL-собес.

5. A/B и эксперименты (60 минут)

Спрашивают: дизайн эксперимента, sample size / MDE / power, ratio-метрики и delta-method, peeking и SRM, switchback (когда применим, когда нет), CUPED для дисперсии, multiple testing. Готовь конкретные кейсы из работы с цифрами и честным анализом null-результатов.

Подготовка: A/B и causal inference.

6. ML system design / продуктовый кейс (60–90 минут)

Кейсы вида: «как ты бы построил LTV-прогноз для нового PC-релиза», «придумай систему рекомендаций для VK Play», «как сделать ML для anti-cheat в шутере». Сильные ответы — где сразу обсуждаются метрики, baseline, итерации, A/B-план и мониторинг. Слабые — где сразу прыгают в архитектуру модели без обсуждения проблемы.

Подготовка: ML system design.

7. Поведенческое (30–45 минут)

С тимлидом и менеджером. STAR-формат, проверяют ownership, кросс-функциональную работу и адекватность.

Особенности по командам

Cross-product DS / Marketing & UA. Горизонтальная команда, отвечающая за маркетинг и UA для всех игр портфеля: attribution-модели, прогноз LTV для performance-маркетинга, оптимизация креативов, бюджет по гео и каналам. Самая большая по численности и самая зрелая по процессам. Подойдёт DS с background в performance-маркетинге, банке или e-commerce.

Game-specific DS (Warface / Hustle Castle / другие). DS, прикреплённый к конкретной игре: retention, LTV, монетизация, content personalization, A/B-эксперименты. Работа в плотной связке с гейм-дизайнерами и продактами. Размер команды зависит от размера игры.

Anti-cheat & integrity. Уникальная и интересная команда: ML для детекции читов в PC-шутерах (особенно в Warface), обнаружение мульти-аккаунтов, попытки эксплойта экономики. Mix CV (детекция aim-bot по поведенческим паттернам), graph ML (поиск сетей аккаунтов), классики. Сюда часто берут DS с background в anti-fraud в финтехе.

VK Play platform DS. Меньше команда: recommendation в магазине игр, search в каталоге, retention на платформе, аналитика трафика. По духу ближе к marketplace-DS, чем к game-DS.

Data Platform / Analytics Engineering. Меньше про ML, больше про DWH, ETL, аналитические витрины. Сюда чаще берут DE, но иногда роль смешанная — DS, который сам строит пайплайны и одновременно делает аналитику поверх. Команда поддерживает стандартизированные витрины для всех команд холдинга и общие правила работы с метриками.

Поведенческая аналитика & community ML. Команда работает с чатами, форумами и community-фичами VK Play и отдельных игр: NLP для модерации, классификация токсичности, sentiment, обнаружение спам-аккаунтов. Стек включает PyTorch и LLM-инструменты Яндекса / open-source. Подойдёт DS с NLP-background или с опытом в social-media-аналитике.

Что MY.GAMES ценит в DS

Production-опыт с цифрами. Weak: «делал модели для retention в e-commerce». Strong: «обучил retention-prediction CatBoost на 5 млн юзеров, time-based валидация, в A/B на 20% трафика за 14 дней +1.2pp D7-retention, p < 0.05, после раскатки эффект сохранился — около +$X в квартал на одной игре». Цифры обязательны.

Понимание разницы между жанрами. Mobile-casual ≠ PC-shooter ≠ web-game ≠ marketplace. Сильные DS отличают, какие метрики важны где, какие модели применимы.

Готовность работать с грязными данными. В крупных холдингах телеметрия часто разная между играми, события устроены неконсистентно. DS, который привык работать только с чистыми датасетами, будет страдать.

A/B-инфраструктура. Понимание, как устроена внутренняя A/B-платформа (нет нужды знать конкретно их, но общая модель — сегментация, splits, dilution, ratio-метрики, sequential — must).

Командная работа. Холдинг большой, кросс-командные проекты — норма. На собесе проверяют готовность согласовывать решения с другими DS и адекватно работать с product / dev / UA.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

Минимум 6–8 недель. Неделя 1–2: ML-теория (классика, метрики, регуляризация). Неделя 3: LeetCode Medium + pandas (60–80 задач). Неделя 4: SQL — оконные функции, ratio-метрики, retention / LTV-формулы. Неделя 5: A/B-теория и расчёты. Неделя 6: ML system design — 4–5 кейсов под разные домены (mobile-F2P retention, PC anti-cheat, marketplace recsys, marketing attribution). Неделя 7: подготовь STAR-истории. Неделя 8: mock-интервью, разбор слабых мест.

Для тренировки на реальных вопросах с DS-собесов — открывай Карьерник: 1500+ задач по SQL, Python, A/B, статистике и ML, отсортированы по темам и уровню сложности.

Частые ошибки

Первая — попытка применить один универсальный паттерн ко всем жанрам. Спрашивают про retention в шутере — а кандидат рассказывает про casual-mobile, как будто это одно и то же. Минус.

Вторая — слабая разница между DS-ролями. В MY.GAMES есть marketing-DS, game-DS, anti-cheat DS, platform-DS — это разные задачи. Если на собесе говоришь обобщённо про «всё что угодно», читается как «не знаю, чего хочу».

Третья — нет цифр в кейсах. Без эффекта на бизнес-метрику кейс не считается. Готовь 3–4 истории с цифрами и честным анализом.

Четвёртая — игнорирование сложности кросс-функциональной работы в крупном холдинге. На вопрос «как ты бы решил спор с другим DS из соседней команды» сильный кандидат говорит про процессы, эскалацию, dataDriven-аргументацию; слабый — «убедил бы». В холдинге так не работает.

Связанные темы

FAQ

Сколько этапов в собесе DS в MY.GAMES?

5–6 этапов: HR-скрининг, тестовое задание (опционально), ML / DS-теория, Python live-coding + SQL, A/B и эксперименты, ML system design / продуктовый кейс, поведенческое. Цикл — 3–5 недель.

Чем отличается DS-роль в marketing от game-DS?

Marketing-DS работает на весь портфель сразу: attribution, прогноз ROI кампаний, оптимизация креативов. Game-DS прикреплён к одной игре и отвечает за retention / LTV / монетизацию.

Нужен ли опыт именно в gaming?

Не обязателен. Сильный DS из e-commerce / финтеха / банка подходит, особенно для marketing / UA или anti-cheat-команд.

Какой английский нужен?

B1–B2 минимум. Для senior — выше, особенно если работа с международными игровыми проектами или с публикациями.

Сколько платят DS в MY.GAMES?

Зависит от грейда и команды. Для middle — на уровне крупных tech-холдингов РФ (Яндекс / Тинькофф / VK), для senior — выше. Marketing / UA-DS обычно платят выше, чем game-specific, из-за объёма бюджетов, которыми они управляют.