Собеседование на Data Scientist в Альфа-Банке

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Альфа-Банк — особенный работодатель для DS

Альфа-Банк — крупнейший частный банк РФ с сильным data-фокусом: ML используется в скоринге, антифроде, маркетинге, NPS, оттоке клиентов. DS-команда работает с табличными данными огромного масштаба, активно применяет gradient boosting (CatBoost), часто с upliftом и calibration.

Особенность: банк работает в регулируемой среде, поэтому DS обязан понимать compliance (152-ФЗ, инструкции ЦБ), интерпретируемость моделей (SHAP, partial dependence), fairness (нельзя дискриминировать по защищённым признакам). Подробнее — на странице карьеры Альфа-Банка.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30 минут)

Опыт, мотивация. Специфика Альфы:

  • Был ли опыт с табличными данными
  • Знание классического ML (LR, GBM, ансамбли)
  • Готовность работать в финтех-домене

2. SQL и Python (45-60 минут)

Live-coding. SQL — оконные функции, JOIN, CTE. Python — pandas, numpy, sklearn pipeline.

3. ML-теория (60-90 минут)

Главный этап. Темы:

  • Classical ML: logistic regression, gradient boosting (CatBoost / XGBoost / LightGBM)
  • Несбалансированные классы (антифрод, default)
  • Метрики: AUC, KS, lift, F1, Gini
  • Calibration (Platt, isotonic)
  • Survival analysis для LTV / time-to-default
  • Интерпретируемость (SHAP, feature importance)

4. ML system design (60 минут)

«Спроектируй модель скоринга по новой кредитке», «детекция fraud в платежах», «churn prediction для премиум-сегмента».

5. Поведенческое (45 минут)

STAR-вопросы.

6. Финал

Стратегический разговор с лидом / VP.

Что Альфа-Банк ценит в DS

  • Classical ML. Gradient boosting, logistic regression, ансамбли — must.
  • Bias / fairness mindset. В скоринге дискриминация по защищённым признакам недопустима.
  • Interpretability. SHAP, partial dependence, feature importance.
  • Compliance-aware. 152-ФЗ, банковские инструкции ЦБ.
  • A/B и causal inference. Эффект модели на бизнес-метрику, не только AUC.

Типичные задачи и кейсы

  • «Спроектируй скоринг новой кредитки. Фичи, модель, метрика, как бизнес использует»
  • «Доля fraud — 0,3%. Какие метрики, как обучать, как threshold выбрать?»
  • «Модель показывает рост revenue в A/B, но регулятор спросит, почему мы отказываем мужчинам чаще»
  • «Churn premium-клиентов +2%. Гипотезы, фичи, модель»
  • «LTV нового клиента на 24 месяца. Survival или regression?»
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. Classical ML. Gradient boosting глубоко (CatBoost — фаворит банков).
  2. Несбалансированные классы. Sampling, class weights, threshold tuning, focal loss.
  3. Метрики classification. AUC, KS, lift, F1, Gini, calibration.
  4. Survival analysis. Cox regression, Kaplan-Meier.
  5. Causal inference. CUPED, uplift modelling.
  6. Compliance. Базовый ликбез по 152-ФЗ, KYC/AML.

Частые ошибки

  • Зубрить deep learning без classical базы. В банковском DS табличные данные — основа.
  • Игнорировать calibration. «AUC 0,85» — недостаточно. Модель должна правильно ранжировать и возвращать осмысленные вероятности.
  • Не учитывать fairness. Скоринг должен объясняться, не дискриминировать.
  • Слабая SQL. В банке без SQL не подсчитаешь даже фичу.

Связанные темы

FAQ

Сколько этапов в собеседовании на DS в Альфа-Банке?

Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 3-5 недель.

Нужен ли deep learning?

В core-командах банка (скоринг, fraud, churn) — нет. В отдельных направлениях (computer vision документов, NLP голосовых ассистентов) — да.

Какие алгоритмы спрашивают?

Classical ML must: logistic regression, gradient boosting (CatBoost / XGBoost / LightGBM), ансамбли. Survival для LTV. Calibration.

Какой уровень SQL ожидается?

Уверенный middle: оконные функции, CTE, JOIN, фильтры.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.