Собеседование на Data Engineer в MY.GAMES
Содержание:
Почему MY.GAMES — особенный работодатель для DE
MY.GAMES — российский игровой холдинг (часть экосистемы VK): десятки игровых проектов разного формата (mobile, PC, browser), миллиарды событий в день суммарно, проекты с очень разной механикой и моделью монетизации (F2P, premium, IAP, подписки). Для Data Engineer это редкая возможность: с одной стороны — единая data-инфраструктура, обслуживающая много проектов, с другой — необходимость работать с проектами разной зрелости и архитектуры. Команда обслуживает Pixonic (War Robots), Allods Team, проекты ME и т.д.
Главные DE-домены: централизованный event-DWH для всех проектов холдинга (единые контракты event-схем), биллинг-DWH для IAP всех проектов, A/B-инфраструктура как product feature для гейм-команд, антифрод и анти-чит pipeline, live-ops аналитика по нескольким проектам, кросс-проектные витрины (player journey между проектами), регуляторная и финансовая отчётность. Из-за многопроектности — большая нагрузка на data quality и контракты event-схем.
Стек: ClickHouse как основной аналитический DWH + Greenplum для финансовых витрин; Kafka и Logbroker для стримов; Airflow + dbt + Spark; S3-compatible хранилища для data lake + Iceberg/Hudi для исторических данных; наследие от VK-стека (Tarantool в отдельных местах). DE-команда центральная, работает плотно с продуктовыми командами проектов и аналитиками.
Актуальные вакансии — на hh.ru и сайте MY.GAMES.
Информация основана на публичных источниках и опыте кандидатов. Команды MY.GAMES используют разные процессы — формат зависит от направления, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 3-5 недель, 4-5 этапов. Процесс прагматичный с product-fit фокусом: HR, техническое интервью, кодинг и SQL, продуктово-архитектурный кейс, финал.
1. HR-скрининг (30 минут)
Рекрутер уточняет: production-опыт DE (от 1.5-2 лет, желательно с большими event-данными или gaming-контекстом), знание ClickHouse и Kafka, мотивацию идти в MY.GAMES, ожидания по компенсации и формату (Москва, удалёнка возможна). Готовь питч на 90 секунд про самый зрелый production-pipeline.
2. Техническое интервью / SQL и архитектура (60-90 минут)
Базовая секция с senior DE из команды. Темы: SQL deep dive (оконки, CTE, оптимизация на event-данных, ClickHouse-специфика — MergeTree, материализованные представления, sequenceCount, retention), модели данных (event-схемы для gaming, измерения player, session, match), batch vs streaming, CDC и event-ingestion, data quality (тесты в dbt, GE), data lineage. Специфический вопрос: «как ты бы построил pipeline с единым event-DWH на 10 разных проектов с разной механикой».
Подготовка: SQL для DE, ClickHouse и OLAP, Kafka streaming.
3. Python + SQL live coding (60 минут)
Задачи прагматичные: 1-2 на SQL (оконки, JOIN, retention-расчёты на event-данных), 1-2 на Python (pandas, простые ETL). Часто живой кейс: «дам тебе таблицу платежей по нескольким играм, посчитай LTV игрока по проектам». Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.
Подготовка: SQL для DE.
4. Продуктово-архитектурный кейс (60-90 минут)
Самая характерная секция. Кейс архитектурный: «спроектируй централизованный event-DWH для холдинга из 10 проектов с разной механикой», «как ты бы построил A/B-инфраструктуру как product feature для гейм-команд», «как сделать unified player journey между проектами холдинга». Нужно: уточнить требования, описать архитектуру, выбрать стек, продумать data quality, обсудить trade-off централизованной vs распределённой модели, заложить план рекавери. Сильный сигнал — учёт multi-project specifics: единые event-схемы vs project-specific extensions, фрагментация vs централизация.
Подготовка: Airflow patterns, Monitoring и data quality.
5. Финал с тимлидом / руководителем направления (45 минут)
Беседа с тимлидом или руководителем. Проверяют поведенческие истории (STAR), отношение к работе с продуктовыми командами проектов, готовность к multi-project работе, обсуждают грейд.
Особенности по командам
Central data platform. Команда строит центральную инфраструктуру event-ingestion, единый event-DWH, схема-регистр для контрактов между проектами и DE. Стек — Kafka + ClickHouse + Schema Registry + кастомные сервисы. Челлендж — schema-evolution для разных проектов, обратная совместимость, контракты с продуктовыми командами. Подойдёт DE с background в platform-инфраструктуре.
IAP и финансовое DWH. Команда отвечает за биллинг IAP всех проектов холдинга: интеграция с Apple/Google/Steam, агрегация платежей, reconciliation, валютная конверсия, refunds. Стек — Greenplum + Airflow + dbt + специализированные коннекторы. Челлендж — несколько валют, refunds, chargebacks, налоги по регионам. Подойдёт DE с financial-DWH опытом.
A/B-инфраструктура как product feature. Команда строит платформу A/B-тестирования для гейм-команд: централизованный сервис распределения, агрегации метрик, статистические расчёты. Стек — ClickHouse + Python + кастомные A/B-инструменты. Челлендж — быстрая обратная связь продактам, network effects между матч-механиками. Подойдёт DE с product analytics background.
Антифрод и анти-чит. Команда строит pipeline детекции бот-аккаунтов, накруток, мошеннических платежей по всем проектам холдинга. Стек — Kafka + ClickHouse + Spark + Catboost (ML-side). Подойдёт DE с антифрод-background.
Cross-project аналитика. Команда строит unified player journey: игрок начал в одной игре MY.GAMES и пробовал другую, как это monetизировать кросс-продажами и игровыми ивентами. Стек — Greenplum + ClickHouse + Spark. Подойдёт DE с CRM или CDP background.
Что MY.GAMES ценит в DE
Production-опыт на event-данных. История про pipeline в проде на миллиардах событий в день. «Запустил unified event-pipeline для 5 проектов холдинга с T+1 SLA и 99.95% доступностью» — это история.
Знание ClickHouse — большой плюс. Gaming-индустрия любит ClickHouse, в MY.GAMES он базовый. Опыт с MergeTree, материализованными представлениями, sequenceCount, retention — мощный сигнал.
Понимание multi-project complexity. Кандидат, который понимает schema-evolution, контракты между командами, обратную совместимость — сильный сигнал.
Weak vs strong на архитектурном кейсе. Слабый ответ: «один большой event-DWH с фиксированной схемой для всех проектов». Сильный ответ: «централизованный event-DWH с core-схемой (player, session, match, payment) и project-specific extensions через nested-структуры. Schema-registry с обязательной обратной совместимостью на ingest. Project-team owns project-specific фичи, central team owns ядро. Reconciliation pipeline для биллинга — отдельный, потому что финансовая отчётность требует другой уровень гарантий, чем product-analytics».
Готовность к темпу. MY.GAMES — gaming, релизы идут часто. Кандидат, который любит длинные циклы, рассматривается слабее.
Self-management. Команды распределённые. DE, который теряется без чёткого ТЗ, рассматривается слабее.
Как готовиться: план
За 4-6 недель до планируемого собеса:
- Неделя 1-2 — SQL deep dive и ClickHouse. Оконные функции, рекурсивные CTE, оптимизация на event-таблицах, ClickHouse-специфика. Прорешай 30 SQL Medium-Hard задач + 15 ClickHouse-специфичных. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день, чтобы за месяц закрыть пробелы по основным конструкциям и не путаться на простых задачах.
- Неделя 3 — Стрим и event-stack. Kafka (topics, partitions, schema-registry), Debezium для CDC, обработка JSON-payload событий, evolution schemes.
- Неделя 4 — Gaming-контекст. Прочитай блоги MY.GAMES, Pixonic Tech, Playrix, Riot Games, Supercell. Запомни понятия: ARPU, ARPPU, LTV, retention, MAU, DAU, sessions, matches, IAP, churn, F2P-метрики, cross-project player journey.
- Неделя 5 — Архитектурные кейсы. Прорешай 5-6 кейсов: централизованный event-DWH для холдинга, schema-evolution для разных проектов, unified IAP-биллинг, A/B-инфраструктура как product, cross-project аналитика. Структура — требования → источники → транспорт → процессинг → витрина → SLA → recovery. Airflow patterns.
- Неделя 6 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: конфликт с продуктовой командой проекта, факап в проде, история про schema-evolution, кейс с multi-project архитектурой.
Частые ошибки
Не знают ClickHouse. В MY.GAMES это базовый стек. Если кандидат не знает MergeTree и материализованные представления — балл проседает.
Не понимают multi-project. Кандидат на System Design рисует «один большой DWH с фиксированной схемой». В холдинге так не работает.
Хайпуют streaming pure-model. Кандидат предлагает event-DWH как pure streaming. Не упоминает, что для retention нужны batch-расчёты.
Игнорируют контракты и schema-evolution. Кандидат не задумывается, как меняется схема, когда продуктовые команды добавляют новые события.
Не задают вопросы про процессы. На кейсе сразу — стек, а не «как мы работаем с продуктовыми командами, как они добавляют события, как мы катим схему». Это первый фильтр.
Связанные темы
- Собеседование на Data Engineer
- ClickHouse и OLAP
- Kafka streaming
- Собеседование на Data Engineer в Pixonic
- Собеседование на Data Scientist в MY.GAMES
FAQ
Удалёнка в MY.GAMES для DE?
Гибрид с офисом в Москве, есть удалёнка для отдельных позиций. После 2022 года часть команд адаптировалась к распределённой работе.
Зарплатные вилки 2026?
Middle DE: 250-380k. Senior: 380-600k. Lead/Staff — выше. Возможны бонусы за успехи проектов. Соцпакет VK-MY.GAMES.
Нужен ли английский?
Базовый — для документации. Свободного говорящего обычно не требуется.
Сколько этапов?
4-5 этапов, 3-5 недель от первого скрининга до оффера. Процесс прагматичный.
Стоит ли идти в MY.GAMES, если опыт только в банке или e-com?
Стоит, особенно если есть опыт работы с event-данными и ClickHouse. Главное — на собесе показать, что понимаешь специфику gaming-метрик и готов быстро доучить F2P-словарь.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.