13 мая 2026 г.·4 мин чтения

Собеседование на Data Scientist в Альфа-Банке

Проверь себя · 1/3разбор после ответа

Как правильно определяется IQR?

Содержание:

Почему Альфа-Банк — особенный работодатель для DS
Этапы собеседования
Что Альфа-Банк ценит в DS
Типичные задачи и кейсы
Как готовиться: план
Частые ошибки
Связанные темы
FAQ

Почему Альфа-Банк — особенный работодатель для DS

Альфа-Банк — крупнейший частный банк РФ с сильным data-фокусом: ML используется в скоринге, антифроде, маркетинге, NPS, оттоке клиентов. DS-команда работает с табличными данными огромного масштаба, активно применяет gradient boosting (CatBoost), часто с upliftом и calibration.

Особенность: банк работает в регулируемой среде, поэтому DS обязан понимать compliance (152-ФЗ, инструкции ЦБ), интерпретируемость моделей (SHAP, partial dependence), fairness (нельзя дискриминировать по защищённым признакам). Подробнее — на странице карьеры Альфа-Банка.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30 минут)

Опыт, мотивация. Специфика Альфы:

Был ли опыт с табличными данными
Знание классического ML (LR, GBM, ансамбли)
Готовность работать в финтех-домене

2. SQL и Python (45-60 минут)

Live-coding. SQL — оконные функции, JOIN, CTE. Python — pandas, numpy, sklearn pipeline.

3. ML-теория (60-90 минут)

Главный этап. Темы:

Classical ML: logistic regression, gradient boosting (CatBoost / XGBoost / LightGBM)
Несбалансированные классы (антифрод, default)
Метрики: AUC, KS, lift, F1, Gini
Calibration (Platt, isotonic)
Survival analysis для LTV / time-to-default
Интерпретируемость (SHAP, feature importance)

4. ML system design (60 минут)

«Спроектируй модель скоринга по новой кредитке», «детекция fraud в платежах», «churn prediction для премиум-сегмента».

5. Поведенческое (45 минут)

STAR-вопросы.

6. Финал

Стратегический разговор с лидом / VP.

Что Альфа-Банк ценит в DS

Classical ML. Gradient boosting, logistic regression, ансамбли — must.
Bias / fairness mindset. В скоринге дискриминация по защищённым признакам недопустима.
Interpretability. SHAP, partial dependence, feature importance.
Compliance-aware. 152-ФЗ, банковские инструкции ЦБ.
A/B и causal inference. Эффект модели на бизнес-метрику, не только AUC.

Типичные задачи и кейсы

«Спроектируй скоринг новой кредитки. Фичи, модель, метрика, как бизнес использует»
«Доля fraud — 0,3%. Какие метрики, как обучать, как threshold выбрать?»
«Модель показывает рост revenue в A/B, но регулятор спросит, почему мы отказываем мужчинам чаще»
«Churn premium-клиентов +2%. Гипотезы, фичи, модель»
«LTV нового клиента на 24 месяца. Survival или regression?»

Готовься к собесу аналитика как в Duolingo

10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram

Открыть Карьерник в Telegram

Как готовиться: план

Classical ML. Gradient boosting глубоко (CatBoost — фаворит банков).
Несбалансированные классы. Sampling, class weights, threshold tuning, focal loss.
Метрики classification. AUC, KS, lift, F1, Gini, calibration.
Survival analysis. Cox regression, Kaplan-Meier.
Causal inference. CUPED, uplift modelling.
Compliance. Базовый ликбез по 152-ФЗ, KYC/AML.

Частые ошибки

Зубрить deep learning без classical базы. В банковском DS табличные данные — основа.
Игнорировать calibration. «AUC 0,85» — недостаточно. Модель должна правильно ранжировать и возвращать осмысленные вероятности.
Не учитывать fairness. Скоринг должен объясняться, не дискриминировать.
Слабая SQL. В банке без SQL не подсчитаешь даже фичу.

Связанные темы

FAQ

Сколько этапов в собеседовании на DS в Альфа-Банке?

Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 3-5 недель.

Нужен ли deep learning?

В core-командах банка (скоринг, fraud, churn) — нет. В отдельных направлениях (computer vision документов, NLP голосовых ассистентов) — да.

Какие алгоритмы спрашивают?

Classical ML must: logistic regression, gradient boosting (CatBoost / XGBoost / LightGBM), ансамбли. Survival для LTV. Calibration.

Какой уровень SQL ожидается?

Уверенный middle: оконные функции, CTE, JOIN, фильтры.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.