Собеседование на Data Engineer в MY.GAMES

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему MY.GAMES — особенный работодатель для DE

MY.GAMES — российский игровой холдинг (часть экосистемы VK): десятки игровых проектов разного формата (mobile, PC, browser), миллиарды событий в день суммарно, проекты с очень разной механикой и моделью монетизации (F2P, premium, IAP, подписки). Для Data Engineer это редкая возможность: с одной стороны — единая data-инфраструктура, обслуживающая много проектов, с другой — необходимость работать с проектами разной зрелости и архитектуры. Команда обслуживает Pixonic (War Robots), Allods Team, проекты ME и т.д.

Главные DE-домены: централизованный event-DWH для всех проектов холдинга (единые контракты event-схем), биллинг-DWH для IAP всех проектов, A/B-инфраструктура как product feature для гейм-команд, антифрод и анти-чит pipeline, live-ops аналитика по нескольким проектам, кросс-проектные витрины (player journey между проектами), регуляторная и финансовая отчётность. Из-за многопроектности — большая нагрузка на data quality и контракты event-схем.

Стек: ClickHouse как основной аналитический DWH + Greenplum для финансовых витрин; Kafka и Logbroker для стримов; Airflow + dbt + Spark; S3-compatible хранилища для data lake + Iceberg/Hudi для исторических данных; наследие от VK-стека (Tarantool в отдельных местах). DE-команда центральная, работает плотно с продуктовыми командами проектов и аналитиками.

Актуальные вакансии — на hh.ru и сайте MY.GAMES.

Информация основана на публичных источниках и опыте кандидатов. Команды MY.GAMES используют разные процессы — формат зависит от направления, уточняйте у рекрутера.

Этапы собеседования

Полный цикл — 3-5 недель, 4-5 этапов. Процесс прагматичный с product-fit фокусом: HR, техническое интервью, кодинг и SQL, продуктово-архитектурный кейс, финал.

1. HR-скрининг (30 минут)

Рекрутер уточняет: production-опыт DE (от 1.5-2 лет, желательно с большими event-данными или gaming-контекстом), знание ClickHouse и Kafka, мотивацию идти в MY.GAMES, ожидания по компенсации и формату (Москва, удалёнка возможна). Готовь питч на 90 секунд про самый зрелый production-pipeline.

2. Техническое интервью / SQL и архитектура (60-90 минут)

Базовая секция с senior DE из команды. Темы: SQL deep dive (оконки, CTE, оптимизация на event-данных, ClickHouse-специфика — MergeTree, материализованные представления, sequenceCount, retention), модели данных (event-схемы для gaming, измерения player, session, match), batch vs streaming, CDC и event-ingestion, data quality (тесты в dbt, GE), data lineage. Специфический вопрос: «как ты бы построил pipeline с единым event-DWH на 10 разных проектов с разной механикой».

Подготовка: SQL для DE, ClickHouse и OLAP, Kafka streaming.

3. Python + SQL live coding (60 минут)

Задачи прагматичные: 1-2 на SQL (оконки, JOIN, retention-расчёты на event-данных), 1-2 на Python (pandas, простые ETL). Часто живой кейс: «дам тебе таблицу платежей по нескольким играм, посчитай LTV игрока по проектам». Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.

Подготовка: SQL для DE.

4. Продуктово-архитектурный кейс (60-90 минут)

Самая характерная секция. Кейс архитектурный: «спроектируй централизованный event-DWH для холдинга из 10 проектов с разной механикой», «как ты бы построил A/B-инфраструктуру как product feature для гейм-команд», «как сделать unified player journey между проектами холдинга». Нужно: уточнить требования, описать архитектуру, выбрать стек, продумать data quality, обсудить trade-off централизованной vs распределённой модели, заложить план рекавери. Сильный сигнал — учёт multi-project specifics: единые event-схемы vs project-specific extensions, фрагментация vs централизация.

Подготовка: Airflow patterns, Monitoring и data quality.

5. Финал с тимлидом / руководителем направления (45 минут)

Беседа с тимлидом или руководителем. Проверяют поведенческие истории (STAR), отношение к работе с продуктовыми командами проектов, готовность к multi-project работе, обсуждают грейд.

Особенности по командам

Central data platform. Команда строит центральную инфраструктуру event-ingestion, единый event-DWH, схема-регистр для контрактов между проектами и DE. Стек — Kafka + ClickHouse + Schema Registry + кастомные сервисы. Челлендж — schema-evolution для разных проектов, обратная совместимость, контракты с продуктовыми командами. Подойдёт DE с background в platform-инфраструктуре.

IAP и финансовое DWH. Команда отвечает за биллинг IAP всех проектов холдинга: интеграция с Apple/Google/Steam, агрегация платежей, reconciliation, валютная конверсия, refunds. Стек — Greenplum + Airflow + dbt + специализированные коннекторы. Челлендж — несколько валют, refunds, chargebacks, налоги по регионам. Подойдёт DE с financial-DWH опытом.

A/B-инфраструктура как product feature. Команда строит платформу A/B-тестирования для гейм-команд: централизованный сервис распределения, агрегации метрик, статистические расчёты. Стек — ClickHouse + Python + кастомные A/B-инструменты. Челлендж — быстрая обратная связь продактам, network effects между матч-механиками. Подойдёт DE с product analytics background.

Антифрод и анти-чит. Команда строит pipeline детекции бот-аккаунтов, накруток, мошеннических платежей по всем проектам холдинга. Стек — Kafka + ClickHouse + Spark + Catboost (ML-side). Подойдёт DE с антифрод-background.

Cross-project аналитика. Команда строит unified player journey: игрок начал в одной игре MY.GAMES и пробовал другую, как это monetизировать кросс-продажами и игровыми ивентами. Стек — Greenplum + ClickHouse + Spark. Подойдёт DE с CRM или CDP background.

Что MY.GAMES ценит в DE

Production-опыт на event-данных. История про pipeline в проде на миллиардах событий в день. «Запустил unified event-pipeline для 5 проектов холдинга с T+1 SLA и 99.95% доступностью» — это история.

Знание ClickHouse — большой плюс. Gaming-индустрия любит ClickHouse, в MY.GAMES он базовый. Опыт с MergeTree, материализованными представлениями, sequenceCount, retention — мощный сигнал.

Понимание multi-project complexity. Кандидат, который понимает schema-evolution, контракты между командами, обратную совместимость — сильный сигнал.

Weak vs strong на архитектурном кейсе. Слабый ответ: «один большой event-DWH с фиксированной схемой для всех проектов». Сильный ответ: «централизованный event-DWH с core-схемой (player, session, match, payment) и project-specific extensions через nested-структуры. Schema-registry с обязательной обратной совместимостью на ingest. Project-team owns project-specific фичи, central team owns ядро. Reconciliation pipeline для биллинга — отдельный, потому что финансовая отчётность требует другой уровень гарантий, чем product-analytics».

Готовность к темпу. MY.GAMES — gaming, релизы идут часто. Кандидат, который любит длинные циклы, рассматривается слабее.

Self-management. Команды распределённые. DE, который теряется без чёткого ТЗ, рассматривается слабее.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 4-6 недель до планируемого собеса:

  1. Неделя 1-2 — SQL deep dive и ClickHouse. Оконные функции, рекурсивные CTE, оптимизация на event-таблицах, ClickHouse-специфика. Прорешай 30 SQL Medium-Hard задач + 15 ClickHouse-специфичных. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день, чтобы за месяц закрыть пробелы по основным конструкциям и не путаться на простых задачах.
  2. Неделя 3 — Стрим и event-stack. Kafka (topics, partitions, schema-registry), Debezium для CDC, обработка JSON-payload событий, evolution schemes.
  3. Неделя 4 — Gaming-контекст. Прочитай блоги MY.GAMES, Pixonic Tech, Playrix, Riot Games, Supercell. Запомни понятия: ARPU, ARPPU, LTV, retention, MAU, DAU, sessions, matches, IAP, churn, F2P-метрики, cross-project player journey.
  4. Неделя 5 — Архитектурные кейсы. Прорешай 5-6 кейсов: централизованный event-DWH для холдинга, schema-evolution для разных проектов, unified IAP-биллинг, A/B-инфраструктура как product, cross-project аналитика. Структура — требования → источники → транспорт → процессинг → витрина → SLA → recovery. Airflow patterns.
  5. Неделя 6 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: конфликт с продуктовой командой проекта, факап в проде, история про schema-evolution, кейс с multi-project архитектурой.

Частые ошибки

Не знают ClickHouse. В MY.GAMES это базовый стек. Если кандидат не знает MergeTree и материализованные представления — балл проседает.

Не понимают multi-project. Кандидат на System Design рисует «один большой DWH с фиксированной схемой». В холдинге так не работает.

Хайпуют streaming pure-model. Кандидат предлагает event-DWH как pure streaming. Не упоминает, что для retention нужны batch-расчёты.

Игнорируют контракты и schema-evolution. Кандидат не задумывается, как меняется схема, когда продуктовые команды добавляют новые события.

Не задают вопросы про процессы. На кейсе сразу — стек, а не «как мы работаем с продуктовыми командами, как они добавляют события, как мы катим схему». Это первый фильтр.

Связанные темы

FAQ

Удалёнка в MY.GAMES для DE?

Гибрид с офисом в Москве, есть удалёнка для отдельных позиций. После 2022 года часть команд адаптировалась к распределённой работе.

Зарплатные вилки 2026?

Middle DE: 250-380k. Senior: 380-600k. Lead/Staff — выше. Возможны бонусы за успехи проектов. Соцпакет VK-MY.GAMES.

Нужен ли английский?

Базовый — для документации. Свободного говорящего обычно не требуется.

Сколько этапов?

4-5 этапов, 3-5 недель от первого скрининга до оффера. Процесс прагматичный.

Стоит ли идти в MY.GAMES, если опыт только в банке или e-com?

Стоит, особенно если есть опыт работы с event-данными и ClickHouse. Главное — на собесе показать, что понимаешь специфику gaming-метрик и готов быстро доучить F2P-словарь.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.