Собеседование на Data Scientist в Belka Games
Содержание:
Почему Belka Games — особенный работодатель для DS
Belka Games — независимая mobile-студия, известная серией casual-проектов Clockmaker и Bermuda Adventures. Студия много лет в топ-100 мобильных издателей по выручке в Европе и СНГ, активная аудитория измеряется миллионами игроков, длинные циклы жизни юзеров. Структура компании компактнее, чем у Playrix или Wildberries: команды меньше, ответственность DS шире, можно влиять на продукт быстрее. Для Data Scientist это работа в плотной связке с продакт-менеджерами и гейм-дизайнерами на mid-core casual-аудитории с упором на retention, монетизацию и контент-персонализацию.
ML-домены: retention prediction (D1, D7, D30), churn-classification и реактивация, LTV-прогноз для маркетинга, uplift-моделирование для CRM-кампаний, recommendation для in-game ивентов и пакетов, антифрод в платежах, segmentation. Стек — Python (pandas, polars), CatBoost / XGBoost, scikit-learn, ClickHouse, Airflow, MLflow, Jupyter / VS Code, внутренний A/B-фреймворк. Доля табличных моделей классической ML — основная, deep learning применяется точечно (recommendations, NLP-обзоры).
Актуальные вакансии — на hh.ru и сайте Belka Games.
Информация основана на публичных источниках и опыте кандидатов. Команды Belka Games используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл 2–4 недели и включает 4–5 этапов. По сравнению с Playrix процесс короче и менее формализован — компактная команда позволяет быстрее принимать решения по найму.
1. HR-скрининг (30–40 минут)
Рекрутер проверяет фон: production-опыт DS (минимум 1 год работы с реальными данными), причины ухода, ожидания, локацию. Опыт в mobile-gaming желателен, но не обязателен — сильная экспертиза в A/B и продуктовой аналитике e-commerce тоже подходит. Подготовь питч 60–90 секунд: имя, ключевые проекты и эффект.
2. Тестовое задание (3–5 дней)
Чаще всего даётся: датасет с игровыми событиями и платежами, нужно построить модель (retention или LTV), описать процесс выбора признаков и валидации, дать рекомендации продукту. Оценивается не «голая» метрика модели, а структурированность подхода и бизнес-интерпретация. Если в задании есть открытая часть — задавай уточняющие вопросы рекрутеру до начала.
3. ML / DS-теория (60–90 минут)
С senior DS из команды. Темы: bias-variance, классические алгоритмы (логистическая регрессия, бустинги, случайный лес), регуляризация, метрики (precision/recall, PR-AUC vs ROC-AUC и когда какая важнее), обработка пропусков и категорий, calibration, имбаланс классов. Доп. блок: uplift-модели (S/T/X-learner, R-learner), survival-анализ для retention. Готовься объяснять выбор алгоритма под конкретную задачу без размытых фраз вроде «зависит от данных».
Подготовка: Классическая ML на собесе, ML-теория.
4. Python + SQL live-coding (60 минут)
Live: 1–2 задачи Python (часто на pandas, реже LeetCode-стиль), 1–2 SQL-задачи на игровых событиях. Типичный SQL: «дан лог матчей и сессий — посчитай D7-retention по когорте регистрации», «найди топ-10 levels с самой большой долей выпадающих игроков». Готовиться: оконные функции, ratio-метрики, ETL-стиль pandas (groupby + agg + merge).
Подготовка: Live-coding.
5. A/B и продуктовая секция (60–90 минут)
Объединяет A/B-теорию и продуктовое мышление. Спрашивают: дизайн эксперимента, sample size, MDE, ratio-метрики, peeking, что делать с null-результатом, как анализировать прирост LTV на коротком тесте, как балансировать длительность теста против бизнес-pressure. Продуктовая часть: «как ты бы измерил эффект новой механики», «как построить retention-кампанию», «как сегментировать платящих». Готовь 2–3 истории из прода с цифрами.
Подготовка: A/B и causal inference.
6. Поведенческое + культурный fit (30–45 минут)
С тимлидом DS или с продактом. STAR-формат: расскажи про конфликт, факап, инициативу. Проверяют ownership, готовность копать и адекватность в коммуникации. Часть собеса может пройти неформально — это плюс компактных студий.
Особенности по командам
Live-game DS (Clockmaker / Bermuda Adventures). Каждый флагман имеет 1–3 DS, отвечающих за весь цикл: retention, LTV, content personalization, A/B-эксперименты, аналитика ивентов. Кросс-функциональная работа с гейм-дизайнерами и продактами. Подойдёт DS, который любит продукт и хочет влиять на конкретные решения, а не только обучать модели.
Monetization & CRM. Меньше команда: модели propensity-to-pay, uplift для рассылок и push-кампаний, оптимизация paywall-офферов, прогноз ARPPU. Тесная связка с маркетинг-аналитикой. Подойдёт DS с background в banking или маркетинг-аналитике e-commerce.
Marketing analytics & UA. Часть про user acquisition: attribution-модели (last-click vs MMM), оптимизация креативов через ML, прогноз ROI кампаний. Если у тебя опыт в performance-маркетинге — это сильный плюс.
Data Platform. Меньше про ML, больше про инфраструктуру: ETL, ClickHouse, Airflow, поддержка стандартизированной аналитической витрины для команд. Сюда чаще берут DE, чем DS, но иногда роль смешанная — DS, который сам пишет пайплайны и одновременно строит модели поверх. Для таких ролей важно знание SQL глубже среднего, понимание индексов и оптимизации запросов, опыт с Airflow и orchestration. Хороший вариант для DS, который хочет постепенно мигрировать в analytics engineering.
Player-research & UX-аналитика. Маленькая команда на стыке DS и UX: качественные интервью, опросники, smart-сегментация для гейм-дизайнеров, помощь в принятии решений по новым механикам. Меньше про ML, больше про продуктовое исследование и работу с гипотезами. Подойдёт DS, который тяготеет к продукту и любит общаться с пользователями.
Что Belka Games ценит в DS
Самостоятельность. Студия компактная — менеджер не будет вести тебя за руку. На собесе проверяют способность брать задачу с минимальным контекстом и доводить до результата. Спрашивают: «как ты бы разбил большую задачу на куски без участия PM?».
Цифры в кейсах. Weak ответ: «строил модели для retention». Strong: «обучил retention-prediction модель на CatBoost, fold-stratified валидация по периодам, в A/B на 30% трафика за 21 день +1.4pp D7-retention, p < 0.05, после раскатки эффект подтвердился, бизнес-эффект — около +$X в месяц». Цифры решают.
Понимание продукта. Готовность установить игру и говорить о ней предметно. На вопрос «что ты бы улучшил в Clockmaker» сильный кандидат отвечает с конкретикой по механикам и сегментам.
Скорость. Студия любит быстро итерироваться. Если ты привык неделю писать тех-задание перед моделью, это будет минусом — ценится умение быстро сделать MVP-модель и итерировать.
Кросс-функциональность. Готовность объяснить модель non-tech коллегам, отказаться от части метрик в пользу понятных продукту, аргументированно спорить с дизайнером.
Как готовиться: план
Минимум 4–6 недель. Неделя 1–2: ML-теория (классика, метрики, регуляризация, calibration). Неделя 3: LeetCode + pandas (50–60 задач). Неделя 4: SQL — оконные функции, retention, LTV-формулы. Неделя 5: A/B — теория, расчёт MDE, обработка ratio-метрик. Неделя 6: установи игру (Clockmaker или Bermuda Adventures) и поиграй 4–5 часов; прочитай 2–3 публичные статьи студии (если есть) и публикации по casual-mobile ML.
Для тренировки реальных вопросов с DS-собесов — открывай Карьерник: 1500+ задач по SQL, Python, A/B-тестам, статистике, продуктовой аналитике и ML, разбиты по темам и уровням.
Частые ошибки
Первая — отсутствие опыта с реальным A/B. Если ты только Kaggle и pet-проекты, секция по экспериментам проваливается. Хотя бы найди 1 кейс из учебной практики или из обзора публичных продуктов и продумай его глубоко.
Вторая — слабое тестовое задание: «гнал CatBoost на всех фичах без анализа», «нет cross-validation по времени», «нет интерпретации feature importance». Лучше сдать проще, но чище.
Третья — нет понимания casual-mobile-специфики. F2P-аудитория сильно «нелинейна»: 5% игроков дают 90% выручки, retention падает резко после первой сессии, ивенты создают всплески активности. Если ты говоришь о casual-mobile как об e-commerce, это режет глаз.
Четвёртая — недооценка важности продуктового мышления. Студия маленькая, DS обязан понимать продукт целиком, а не только свою feature. На вопрос «что бы ты улучшил в Clockmaker» нет правильного «учебного» ответа: интервьюер ждёт конкретики по конкретной механике, конкретному ивенту и конкретной метрике, на которую это повлияет. Если ты говоришь обобщённо «улучшил бы onboarding» — это минус, потому что любой может это сказать.
Связанные темы
- Собеседование на Data Scientist в Playrix
- Собеседование на Data Scientist в Pixonic
- Собеседование на ML Engineer в Belka Games
- Собеседование на Data Scientist — гайд
FAQ
Сколько этапов в собесе DS в Belka Games?
4–5 этапов: HR-скрининг, тестовое задание, ML / DS-теория, Python + SQL live-coding, A/B и продуктовая секция, поведенческое. Цикл — 2–4 недели.
Нужен ли опыт именно в gaming?
Желателен, но не обязателен. Сильный опыт в A/B-экспериментах и продуктовом DS в e-commerce / финтехе тоже подходит. Главное — установи игру и пойми механики до собеса.
Что важнее — теория ML или практика A/B?
В равной степени важны. Сильная теория без опыта продакшна не пройдёт; сильная практика без понимания фундамента — тоже. Готовь обе стороны.
Какой английский нужен?
B1–B2 минимум. Внутренние коммуникации в основном на русском, но документация и часть процессов могут быть на английском.
Сколько платят DS в Belka Games?
Зависит от грейда. Для middle DS — на уровне крупных tech-компаний, для senior — выше. Студия конкурирует с Playrix / Pixonic / My.Games по компенсации, особенно за сильных кандидатов.