Собеседование на Data Engineer в Pixonic

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Pixonic — особенный работодатель для DE

Pixonic (часть MY.GAMES) — российская студия с флагманом War Robots, мобильным многопользовательским шутером с миллионами активных игроков и десятилетней историей. Для Data Engineer это очень специфический контекст: gaming-данные это миллиарды событий в день из множества платформ (iOS, Android), event-стримы с экстремально высокой кардинальностью, биллинг in-app purchases (IAP) и подписок, A/B-инфраструктура для гейм-дизайнеров, антифрод и анти-чит-pipeline. Цикл проектов короче, чем в банке: гейм-дизайнер хочет результат теста через неделю, а не через квартал.

Главные DE-домены: event-DWH (миллиарды игровых событий в день — sessions, matches, IAP, ad-impressions, item-acquisitions), биллинг-DWH для IAP и подписок (Apple/Google пейменты), A/B-инфраструктура для гейм-фич, recsys data layer (рекомендация противников, наборов, акций), антифрод и анти-чит pipeline (детекция бот-аккаунтов, накруток рейтинга), live-ops аналитика (как игроки реагируют на ивенты в реальном времени), regulatory отчётность.

Стек: ClickHouse как основной аналитический DWH (gaming-индустрия его любит) + Greenplum для финансовых витрин; Kafka для стримов событий; Airflow + dbt + Spark; AWS S3-compatible хранилища для data lake; собственные сервисы для агрегации игровых сессий. Часть стека наследуется от MY.GAMES (общие инструменты группы).

Актуальные вакансии — на hh.ru и сайте Pixonic / MY.GAMES.

Информация основана на публичных источниках и опыте кандидатов. Команды Pixonic используют разные процессы — формат и этапы зависят от направления и грейда, уточняйте у рекрутера.

Этапы собеседования

Полный цикл — 3-5 недель, 4-5 этапов. Процесс прагматичный, gaming-индустрия любит скорость: HR, техническое интервью, кодинг и SQL, продуктово-архитектурный кейс, финал с командой. Алгоритмическая планка средняя, без LeetCode Hard.

1. HR-скрининг (30 минут)

Рекрутер уточняет: production-опыт DE (от 1.5-2 лет, желательно с большими event-данными или gaming-контекстом), знание ClickHouse и Kafka, мотивацию идти в Pixonic, ожидания по компенсации и формату (Москва, есть гибрид). Готовь питч на 90 секунд про самый зрелый production-pipeline.

2. Техническое интервью / SQL и архитектура (60-90 минут)

Базовая секция с senior DE из команды. Темы: SQL deep dive (оконные функции, рекурсивные CTE, оптимизация запросов на event-данных, partitioning, ClickHouse-специфика — MergeTree, материализованные представления, sequenceCount, retention-функции), модели данных (event-схемы для gaming, измерения player, session, match), batch vs streaming, CDC и event-ingestion, data quality. Специфический вопрос: «как ты бы построил pipeline для расчёта retention D1/D7/D30 на десятки миллионов player_id с обновлением раз в сутки».

Подготовка: SQL для DE, ClickHouse и OLAP, Kafka streaming.

3. Python + SQL live coding (60 минут)

Задачи прагматичные: 1-2 на SQL (оконки, JOIN, retention-расчёты), 1-2 на Python (pandas, простые ETL, обработка JSON-event-payload). Часто живой кейс: «дам тебе таблицу сессий и платежей, посчитай ARPPU по сегментам игроков». Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python. ClickHouse-специфика — большой плюс.

Подготовка: SQL для DE.

4. Продуктово-архитектурный кейс (60-90 минут)

Самая характерная секция. Кейс архитектурный: «спроектируй event-DWH для мобильной игры с миллиардом событий в день», «как ты бы построил A/B-инфраструктуру для гейм-фич с быстрой обратной связью гейм-дизайнерам», «как сделать антифрод-pipeline на платежах IAP и накрутках рейтинга». Нужно: уточнить требования, описать архитектуру, выбрать стек, продумать data quality и monitoring, обсудить trade-off batch vs streaming, заложить план рекавери. Сильный сигнал — учёт gaming-специфики: event-flood в моменты live-ops, ABT-фичи с быстрой обратной связью, специфика мобильных платформ.

Подготовка: Airflow patterns, Monitoring и data quality.

5. Финал с командой / тимлидом (45 минут)

Беседа с тимлидом или представителем команды. Проверяют поведенческие истории (STAR), отношение к работе с гейм-дизайнерами и продактами, готовность к быстрому темпу live-ops, обсуждают грейд.

Особенности по командам

Event-DWH и core analytics. Команда строит event-DWH War Robots и других проектов: миллиарды событий в день, retention/ARPU/ARPPU/LTV витрины, ABT-расчёты. Стек — ClickHouse + Kafka + Airflow + dbt + Spark. Челлендж — event-flood в моменты live-ops, ABT с миллионами игроков. Подойдёт DE с background в gaming или mobile-аналитике.

IAP-биллинг и финансовые витрины. Команда отвечает за биллинг in-app purchases и подписок: интеграция с Apple App Store, Google Play, агрегация платежей, reconciliation с финансовой системой. Стек — Greenplum + Airflow + dbt + специализированные коннекторы к Apple/Google. Челлендж — корректность (платежи в разных валютах, refunds, chargebacks), reconciliation с банковскими выписками. Подойдёт DE с financial-DWH опытом.

A/B-инфраструктура. Команда строит платформу A/B-тестирования для гейм-дизайнеров: распределение игроков по группам, агрегация метрик теста, статистические расчёты, dashboards. Стек — ClickHouse + Python + кастомные A/B-инструменты. Челлендж — быстрая обратная связь (гейм-дизайнер хочет результат за неделю), множественные одновременные тесты, network effects между матч-механикой. Подойдёт DE с background в product analytics или статистике.

Антифрод и анти-чит. Команда строит pipeline детекции бот-аккаунтов, накруток рейтинга, мошеннических платежей. Стек — Kafka + ClickHouse + Spark + Catboost (ML-side) + graph-анализ. Челлендж — adversarial-задачи (читеры меняют тактику), низкий false-positive (бан легитимного игрока — потеря клиента). Подойдёт DE с антифрод-background или security.

Live-ops и real-time аналитика. Команда строит real-time витрины для live-ops: как игроки реагируют на ивенты в реальном времени, оперативные дашборды для гейм-дизайнеров. Стек — Kafka + ClickHouse с TTL + кастомные стриминговые сервисы. Подойдёт DE с background в стримах.

Что Pixonic ценит в DE

Production-опыт на event-данных. История про pipeline в проде на миллиардах событий в день. «Запустил event-DWH War Robots на 2B событий в день, retention-витрины T+1 SLA» — это история.

Знание ClickHouse — большой плюс. Gaming-индустрия любит ClickHouse, в Pixonic он базовый. Опыт с MergeTree, материализованными представлениями, sequenceCount, retention-функциями — мощный сигнал.

Понимание gaming-метрик. ARPU, ARPPU, LTV, retention D1/D7/D30, stickiness (DAU/MAU), conversion в платящих — базовый словарь. Если не работал в gaming — освежи до собеса.

Weak vs strong на архитектурном кейсе. Слабый ответ: «возьмём Kafka и Spark Streaming для event-DWH, real-time, modern stack». Сильный ответ: «event-DWH gaming — это Kafka для ingestion + ClickHouse для аналитики. Сырые события идут в ClickHouse через Kafka-table-engine с минимальной обработкой. Сверху — материализованные представления с retention-функциями и agg-states для retention D1/D7/D30, ARPPU, LTV. Для A/B — отдельные витрины по тестам с быстрым доступом гейм-дизайнерам. Spark остаётся для тяжёлых batch-расчётов раз в день (LTV-модели, сегментация). Streaming как pure model не подойдёт — для retention нужны batch-расчёты по cohorts с lookback».

Готовность к быстрому темпу. Pixonic — gaming, релизы идут часто, live-ops каждую неделю. Кандидат, который любит длинные циклы и идеальный pipeline без MVP, рассматривается слабее.

Self-management и проактивность. Команды небольшие. DE, который теряется без чёткого ТЗ, рассматривается слабее.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 4-6 недель до планируемого собеса:

  1. Неделя 1-2 — SQL deep dive и ClickHouse. Оконные функции, рекурсивные CTE, оптимизация на event-таблицах, ClickHouse-специфика (MergeTree, материализованные представления, sequenceCount, retention, argMax). Прорешай 30 SQL Medium-Hard задач + 15 ClickHouse-специфичных. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день, чтобы за месяц закрыть пробелы по основным конструкциям и не путаться в простых задачах.
  2. Неделя 3 — Стрим и event-stack. Kafka (topics, partitions, consumer groups, exactly-once), Debezium для CDC, schema registry, обработка JSON-payload событий.
  3. Неделя 4 — Gaming-контекст. Прочитай блоги MY.GAMES, Pixonic Tech, Playrix, Riot Games, Supercell про data infrastructure. Запомни понятия: ARPU, ARPPU, LTV, retention, MAU, DAU, sessions, matches, IAP, churn, F2P-метрики.
  4. Неделя 5 — Архитектурные кейсы. Прорешай 5-6 кейсов: event-DWH миллиардов событий, retention D1/D7/D30 на десятках миллионов player_id, IAP-биллинг с reconciliation, A/B-инфраструктура с быстрой обратной связью, антифрод платежей. Структура — требования → источники → транспорт → процессинг → витрина → SLA → recovery. Airflow patterns.
  5. Неделя 6 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: конфликт с гейм-дизайнером, факап в проде на live-ops ивенте, история про быстрый пилот, кейс с antifraud.

Частые ошибки

Не знают ClickHouse. В Pixonic это базовый стек. Если кандидат не знает MergeTree и материализованные представления — балл проседает.

Не понимают gaming-метрик. «Что такое ARPU vs ARPPU, retention D1 vs D30, stickiness?» — кандидат теряется. На продуктовом кейсе это сразу видно.

Хайпуют streaming pure-model. Кандидат предлагает event-DWH как pure streaming. Не упоминает, что для retention нужны batch-расчёты по cohorts.

Игнорируют event-flood. В моменты live-ops event-rate взлетает в 5-10 раз. Кандидат, который не учитывает это в дизайне (backpressure, auto-scaling, batch-toleration), теряет балл.

Не задают вопросы про объёмы и платформы. На кейсе сразу — стек, а не «сколько событий, какие платформы (iOS, Android), какие SLA, какие requirements live-ops». Это первый фильтр.

Связанные темы

FAQ

Удалёнка в Pixonic для DE?

Гибрид с офисом в Москве. Полная удалёнка возможна для отдельных позиций (senior+). Часть команд после 2022 года адаптировалась к распределённому формату.

Зарплатные вилки 2026?

Middle DE: 250-380k. Senior: 380-600k. Lead/Staff — выше. Возможны бонусы за live-ops успехи и проекты. Соцпакет MY.GAMES.

Нужен ли английский?

Базовый — для документации. Свободного говорящего обычно не требуется, основная команда русскоязычная.

Сколько этапов?

4-5 этапов, 3-5 недель от первого скрининга до оффера. Процесс быстрый, gaming-индустрия любит скорость.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.