Собеседование на Data Engineer в Belka Games
Содержание:
Почему Belka Games — особенный работодатель для DE
Belka Games — мобильная гейм-студия с фокусом на казуальные F2P-проекты (Clockmaker, Solitaire Cruise, Wonderful Cities, Funky Bay): миллионы активных игроков, выход в глобальные топы App Store и Google Play, серьёзная LiveOps и UA-машина. Для Data Engineer это очень data-driven контекст: F2P-модель монетизации требует тщательной аналитики retention и LTV, A/B-инфраструктура — base feature продукта, а не nice-to-have. Команда DE плотно работает с гейм-дизайнерами, продуктами и UA-специалистами.
Главные DE-домены: event-DWH мобильных F2P-проектов (миллиарды событий в день — sessions, levels, IAP, ads, social), биллинг-DWH для IAP и подписок (Apple/Google), A/B-инфраструктура как продуктовая функция (миллионы игроков, десятки одновременных тестов), UA и attribution-pipeline (интеграция с AppsFlyer, Adjust, мониторинг ROAS по каналам), retention-витрины (D1/D7/D30/D90), CRM-аналитика и personalized offers, антифрод платежей и читов.
Стек: ClickHouse + Greenplum + Airflow + dbt + Spark; Kafka для event-ingestion; собственные сервисы для агрегации игровых сессий и A/B; интеграции с AppsFlyer / Adjust для UA; AWS / Yandex Cloud для инфраструктуры. Команда заметно выросла за последние годы — Belka Games инвестирует в data-направление.
Актуальные вакансии — на hh.ru и сайте Belka Games.
Информация основана на публичных источниках и опыте кандидатов. Команды Belka Games используют разные процессы — формат и этапы зависят от направления, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 3-5 недель, 4-5 этапов. Процесс прагматичный, gaming-индустрия любит скорость: HR, техническое интервью, кодинг и SQL, продуктово-архитектурный кейс, финал.
1. HR-скрининг (30 минут)
Рекрутер уточняет: production-опыт DE (от 1.5-2 лет, желательно с большими event-данными или mobile-gaming), знание ClickHouse и Kafka, мотивацию идти в Belka Games, ожидания по компенсации и формату (Москва, есть гибрид/удалёнка). Готовь питч на 90 секунд про самый зрелый production-pipeline.
2. Техническое интервью / SQL и архитектура (60-90 минут)
Базовая секция с senior DE из команды. Темы: SQL deep dive (оконные функции, рекурсивные CTE, оптимизация на event-данных, ClickHouse-специфика — MergeTree, материализованные представления, sequenceCount, retention-функции), модели данных (event-схемы для F2P, измерения player, session, level, IAP), batch vs streaming, CDC, data quality, data lineage. Специфический вопрос: «как ты бы построил cohort-retention pipeline на 50М игроков с обновлением каждый день и lookback на 90 дней».
Подготовка: SQL для DE, ClickHouse и OLAP, Kafka streaming.
3. Python + SQL live coding (60 минут)
Задачи прагматичные: 1-2 на SQL (оконки, JOIN, retention-расчёты), 1-2 на Python (pandas, ETL). Часто живой кейс: «дам тебе таблицу игровых сессий и IAP, посчитай конверсию в платящих и средний чек первой покупки по сегментам». Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.
Подготовка: SQL для DE.
4. Продуктово-архитектурный кейс (60-90 минут)
Самая характерная секция. Кейс архитектурный: «спроектируй A/B-инфраструктуру для F2P игры на 5М DAU с десятками одновременных тестов», «как ты бы построил pipeline атрибуции UA с интеграцией AppsFlyer/Adjust и расчётом ROAS по каналам», «как сделать real-time мониторинг live-ops ивента». Нужно: уточнить требования, описать архитектуру, выбрать стек, продумать data quality и monitoring, обсудить trade-off, заложить план рекавери. Сильный сигнал — учёт F2P-специфики: маленькая доля платящих (5-10%), важность retention long-tail, ROAS-окно атрибуции.
Подготовка: Airflow patterns, Monitoring и data quality.
5. Финал с тимлидом / руководителем направления (45 минут)
Беседа с тимлидом или руководителем. Проверяют поведенческие истории (STAR), отношение к работе с гейм-дизайнерами и UA-специалистами, готовность к быстрому темпу.
Особенности по командам
Event-DWH и core analytics. Команда строит event-DWH F2P-проектов: миллиарды событий в день, retention/ARPU/ARPPU/LTV витрины. Стек — ClickHouse + Kafka + Airflow + dbt + Spark. Челлендж — масштаб событий, retention long-tail (90+ дней). Подойдёт DE с background в mobile-gaming или event-аналитике.
IAP-биллинг и финансовое DWH. Команда отвечает за биллинг IAP всех проектов: Apple/Google, разные валюты, refunds, chargebacks, reconciliation. Стек — Greenplum + Airflow + dbt + специализированные коннекторы. Подойдёт DE с financial-DWH опытом.
A/B-инфраструктура. Команда строит платформу A/B-тестирования: распределение, агрегация метрик, статистические расчёты, dashboards для гейм-дизайнеров. Стек — ClickHouse + Python + кастомные A/B-инструменты. Челлендж — миллионы игроков, десятки одновременных тестов, network effects. Подойдёт DE с product analytics background.
UA и attribution. Команда строит pipeline UA-attribution с интеграцией AppsFlyer/Adjust, расчёт ROAS по каналам, моделирование LTV для UA-решений. Стек — Spark + ClickHouse + кастомные коннекторы к UA-провайдерам. Подойдёт DE с интересом к marketing analytics.
CRM и personalized offers. Команда строит витрины для CRM-кампаний и personalized offers: сегментация платящих, prediction churn, recommendation предложений. Стек — Catboost (ML-side) + Greenplum + ClickHouse + dbt. Подойдёт DE с CRM-фоном.
Что Belka Games ценит в DE
Production-опыт на event-данных. История про pipeline в проде на миллиардах событий в день. «Запустил retention-pipeline на 50М игроков с T+1 SLA и lookback 90 дней» — это история.
Знание ClickHouse — большой плюс. Gaming-индустрия любит ClickHouse, в Belka Games он базовый.
Понимание F2P-метрик. ARPU, ARPPU, conversion в платящих, LTV, retention D1/D7/D30/D90, ROAS, payback period, CPI, CTR ads — базовый словарь. Если не работал в F2P — освежи до собеса.
Weak vs strong на архитектурном кейсе. Слабый ответ: «возьмём Spark + Greenplum для retention pipeline». Сильный ответ: «retention pipeline — это batch с lookback. ClickHouse с retention-функцией закрывает 90% задачи в одном запросе с материализованным представлением для cohort × day. Spark — для тяжёлых LTV-моделей раз в день. Lookback 90 дней решается через partitioned-таблицы с player_id + day и хранением свежих cohorts. Метрика — не просто accuracy, а consistency между retention из dashboard и cohort-табличной выгрузкой».
Готовность к быстрому темпу и UA-данным. В Belka Games UA-машина крутится, релизы идут часто. Кандидат, который любит длинные циклы, рассматривается слабее.
Self-management. Команды компактные. DE, который теряется без чёткого ТЗ, рассматривается слабее.
Как готовиться: план
За 4-6 недель до планируемого собеса:
- Неделя 1-2 — SQL deep dive и ClickHouse. Оконные функции, рекурсивные CTE, оптимизация на event-таблицах, ClickHouse-специфика (MergeTree, материализованные представления, retention-функция, sequenceCount). Прорешай 30 SQL Medium-Hard задач + 15 ClickHouse-специфичных. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день, чтобы за месяц закрыть пробелы по основным конструкциям.
- Неделя 3 — Стрим и UA stack. Kafka (topics, partitions, schema-registry), Debezium, основы AppsFlyer/Adjust APIs, attribution-модели.
- Неделя 4 — Mobile gaming F2P контекст. Прочитай блоги Belka Games, Playrix, GameAnalytics, Mixpanel про F2P-метрики. Запомни понятия: ARPU, ARPPU, retention, MAU, DAU, IAP, ROAS, CPI, payback period, attribution window, organic vs paid.
- Неделя 5 — Архитектурные кейсы. Прорешай 5-6 кейсов: cohort-retention на десятках миллионов player_id, A/B-инфраструктура для F2P, UA-attribution pipeline, IAP-биллинг с reconciliation, антифрод платежей. Структура — требования → источники → транспорт → процессинг → витрина → SLA → recovery. Airflow patterns.
- Неделя 6 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: конфликт с гейм-дизайнером, факап в проде, история про быстрый пилот A/B, кейс про ROAS-аналитику.
Частые ошибки
Не знают ClickHouse retention-функции. В Belka Games это базовый инструмент. Если кандидат не знает retention() в ClickHouse — балл проседает.
Не понимают F2P-метрик. «Что такое ROAS, CPI, payback period?» — кандидат теряется на UA-кейсах.
Хайпуют streaming pure-model. Кандидат предлагает event-DWH как pure streaming. Не упоминает, что для retention нужны batch-расчёты по cohorts.
Игнорируют атрибуцию. UA — критичная для F2P часть бизнеса. Кандидат, который не задаёт вопросы про AppsFlyer и attribution-window, теряет балл.
Не задают вопросы про объёмы и платформы. На кейсе сразу — стек, а не «сколько DAU, какие платформы, какие SLA, какая attribution-модель». Это первый фильтр.
Связанные темы
- Собеседование на Data Engineer
- ClickHouse и OLAP
- Kafka streaming
- Собеседование на Data Engineer в Pixonic
- Собеседование на Data Scientist в Belka Games
FAQ
Удалёнка в Belka Games для DE?
Активная удалёнка и гибрид. Команда исторически работала в распределённом режиме, особенно после 2022 года.
Зарплатные вилки 2026?
Middle DE: 240-360k. Senior: 360-560k. Lead/Staff — выше. Возможны бонусы за успехи проектов.
Нужен ли английский?
Базовый — для документации и работы с международными UA-провайдерами. Свободного говорящего обычно не требуется.
Сколько этапов?
4-5 этапов, 3-5 недель от первого скрининга до оффера. Процесс быстрый, gaming-индустрия любит скорость.
Реально ли пройти без gaming-опыта?
Реально, особенно для DE-позиций — главное хорошо знать ClickHouse и event-DWH. F2P-словарь и UA-метрики можно подучить за 1-2 недели до собеса. Senior+ позиции с product analytics уклоном сложнее без gaming-фона.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.