Собеседование на Data Scientist в ПСБ

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему ПСБ — особенный работодатель для DS

ПСБ (Промсвязьбанк) — один из крупнейших российских системно-значимых банков, исторически с сильной позицией в корпоративном обслуживании и обслуживании ОПК / государственных контрактов. В последние годы — активное расширение в розничном направлении. Для Data Scientist это среда с уникальной комбинацией: классический банкинг с retail-сегментом плюс серьёзная корпоративная аналитика с очень крупными контрактами и сложной структурой клиентов. Технологически ПСБ следует общеотраслевому стандарту: упор на интерпретируемые модели, regulatory compliance, аккуратную validation-функцию.

ML-домены: кредитный скоринг (PD/EAD/LGD для retail и corporate), антифрод в транзакциях и заявках, AML / KYC-аналитика, churn prediction для розничных продуктов, customer LTV и cross-sell, корпоративная риск-аналитика (большая часть бизнеса ПСБ), NLP на текстах обращений и документов, маркетинг-DS. Стек: Python, scikit-learn, CatBoost, R для regulatory-моделей, PostgreSQL, Oracle для core-banking, Hadoop / Spark, Airflow, MLflow.

Актуальные вакансии — на hh.ru и сайте ПСБ.

Информация основана на публичных источниках и опыте кандидатов. Команды ПСБ используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

Цикл 4–6 недель и включает 5–6 этапов. Процесс корпоративный, ближе к большим традиционным банкам. Серьёзная validation-функция означает дополнительные проверки для middle+ позиций.

1. HR-скрининг (30–45 минут)

Рекрутер проверяет: production-опыт DS (1.5+ года), причины смены работы, ожидания, готовность работать с государственным и корпоративным сегментом. Опыт в banking-scoring, антифроде, AML — большой плюс.

2. Тестовое задание (3–7 дней)

Часто даётся: датасет с историей кредитов или транзакций, нужно построить скоринг или модель fraud. Особенность — высокие требования к chronological валидации и обоснованию выбора метрики под бизнес-задачу.

3. ML / DS-теория (60–90 минут)

С senior DS из команды. Темы: классика (логистическая регрессия, GLM, бустинги, regularization, calibration), метрики (Gini, KS, PSI, lift), survival для churn, основы IFRS-9 и Basel-методологии, причинно-следственный анализ. Доп. блок для corporate — портфельная аналитика и оценка концентрации.

Подготовка: Классическая ML на собесе, Метрики модели.

4. Python + SQL live-coding (60–90 минут)

Live: 1 алгоритмическая задача (LeetCode Medium), 1–2 на pandas, 1–2 на SQL по банковским данным. SQL на PostgreSQL / Oracle — оконки, complex JOIN, ratio-метрики.

Подготовка: Live-coding, SQL-собес.

5. ML system design + бизнес-кейс (60–90 минут)

Кейсы: «как ты бы построил скоринг для корпоративного кредита», «как обнаружить fraud в крупных транзакциях», «как сегментировать корпоративных клиентов для cross-sell». Сильные ответы — где обсуждаются интерпретация, regulatory ограничения, validation-процесс.

6. Поведенческое + safety (30–45 минут)

С тимлидом и менеджером. STAR-формат. Доп. блок — проверка готовности работать с чувствительными данными (госконтракты, ОПК).

Особенности по командам

Retail Credit Scoring. PD/EAD/LGD-модели для розничных кредитов: потребкредиты, кредитные карты, ипотека. Тесная связка с risk-функцией. Подойдёт DS с background в banking-scoring.

Corporate Risk & Industrial Analytics. Главная и характерная для ПСБ команда: моделирование рисков для корпоративных клиентов, включая ОПК и крупных промышленных, оценка кредитоспособности через сочетание ML и экспертных оценок. Подойдёт senior DS с интересом к корпоративной аналитике и сложным сегментам.

Antifraud & AML. Детекция fraud в транзакциях и заявках, AML-аналитика (отмывание, подозрительные паттерны, особенно по крупным суммам корпоративных клиентов), KYC-моделирование. Mix классики, графовых подходов, NLP. Регуляторно-жёсткая зона ответственности.

Churn & Retention (Retail). Прогноз ухода клиента по продуктам, реактивация спящих.

Marketing & Acquisition. Атрибуция, прогноз ROI кампаний, скоринг лидов, оптимизация креативов.

Capital & Stress-testing. Меньше команда, но важная: моделирование portfolio в стрессовых сценариях, оценка достаточности капитала, Basel-аналитика.

Validation & Model Risk Management. «Вторая линия защиты» — валидация всех моделей перед раскаткой, мониторинг в продакшене, регуляторное взаимодействие. В ПСБ серьёзная зона, особенно для регуляторно-значимых моделей.

Defence Sector Analytics. Уникальная для ПСБ команда: моделирование рисков по ОПК-сегменту и государственным контрактам, оценка кредитоспособности оборонных предприятий. Доступ к данным сильно регулируется, работа требует соответствующих допусков.

Mortgage Analytics. Меньше команда: скоринг под ипотеку, прогноз prepayment, оптимизация цены. Особенность ипотеки — длинный горизонт и низкая частота дефолтов делают модели менее «динамичными», чем в обычном потребкредитовании.

Что ПСБ ценит в DS

Глубина в banking-scoring. Strong: «обучил CatBoost scorecard на 800k retail-заявок, calibration через isotonic, monotone constraints на возраст и доход, KS 35 в out-of-time, бизнес-эффект — +3.5pp approval rate без роста NPL за 6 месяцев». Цифры обязательны.

Опыт работы с регулятором. Понимание Basel, IFRS-9, требований ЦБ — must для middle+.

Интерпретируемость моделей. Black-box не пройдёт validation-функцию. SHAP, monotone constraints, PSI-мониторинг — стандарт.

Готовность к корпоративной структуре. ПСБ — большой банк с формальными процессами. Способность работать в них — критично.

Аккуратность. Validation-функция ПСБ серьёзная, и каждый шаг моделирования будет проверен. Кандидат, у которого notebook чистый и каждое решение обоснованно, выделяется.

Знание корпоративного сегмента. Если ты хочешь в команду Corporate Risk, готовь хотя бы один кейс на корпоративную аналитику.

Долгосрочное мышление и validation-готовность. В ПСБ validation-функция найдёт каждое слабое место в моделировании. Strong-кандидат заранее обсуждает chronological split, out-of-time валидацию, обоснование выбора метрики под бизнес-задачу, план мониторинга смещений и переобучения. Долгосрочное мышление о жизни модели в проде ценится выше «голой» метрики.

Зрелость в коммуникации. Банк — это много стейкхолдеров: risk, продукт, юристы, аудит, регулятор. На собесе проверяют способность объяснить модель не-тех аудитории и работать в формальных процессах согласования. STAR-истории про конфликт с другими командами и успешное разрешение — must-prepare для middle+.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

Минимум 6–8 недель. Неделя 1–2: ML-теория (классика, GLM, бустинги, calibration). Неделя 3: LeetCode + pandas (40 задач). Неделя 4: SQL — оконки, complex JOINs. Неделя 5: banking-scoring (scorecard, IFRS-9, Basel basics). Неделя 6: A/B и interpretability. Неделя 7: ML system design — 4 кейса (retail-scoring, corporate-risk, antifraud, AML). Неделя 8: mock-интервью.

Для тренировки реальных вопросов с DS-собесов — открывай Карьерник: 1500+ задач по SQL, Python, A/B-тестам, статистике, продуктовой аналитике и ML по темам и сложности.

Частые ошибки

Первая — слабое понимание corporate-сегмента. Это половина бизнеса ПСБ, и кандидат, фокусирующийся только на retail, теряет важное преимущество.

Вторая — black-box модель без интерпретации. Validation в ПСБ серьёзная, и black-box не пройдёт.

Третья — игнорирование regulatory-стороны. Без знания Basel, IFRS-9, требований ЦБ — gap.

Четвёртая — нет цифр в кейсах. На вопрос про самый успешный проект сильный ответ с конкретными метриками — approval rate, NPL, capital adequacy.

Пятая — слабая аккуратность процесса. Validation-функция найдёт каждую слабость в твоей валидации модели. Готовь chronological split, out-of-time validation, обоснование выбора метрики.

Шестая — попытка работать «вне процесса». В ПСБ согласование любого изменения модели проходит через формальные стадии validation, governance, compliance. Кандидат, привыкший к гибким процессам стартапа, столкнётся с серьёзными ограничениями. Готовность к процессной работе — критично.

Седьмая — недооценка важности specifically corporate-аналитики. ПСБ исторически сильно corporate-ориентирован, и кандидат, фокусирующийся только на retail, упускает половину разговора с интервьюером.

Связанные темы

FAQ

Сколько этапов в собесе DS в ПСБ?

5–6 этапов: HR-скрининг, тестовое задание, ML / DS-теория, Python + SQL live-coding, ML system design + бизнес-кейс, поведенческое + safety. Цикл — 4–6 недель.

Нужен ли опыт в банке?

Желателен, особенно если идёшь в risk-функцию. Готовность учить banking-scoring basics, IFRS-9, Basel — must.

Чем DS в ПСБ отличается от DS в Сбере?

ПСБ меньше по размеру, но имеет уникальные corporate / industrial / ОПК-сегменты. Сбер — больше по retail-объёму и шире по продуктам, плюс отдельная сильная AI-команда.

Какой английский нужен?

B1–B2 минимум. Документация и часть инструментов на английском.

Сколько платят DS в ПСБ?

Зависит от грейда. Для middle DS — на уровне крупных банков РФ (Сбер / ВТБ / Открытие), для senior — выше. Corporate Risk и AML команды обычно платят на премиум-грейде из-за специфики и регуляторной ответственности.

Какой стек чаще встречается?

Python + scikit-learn + CatBoost для retail-задач, R + GLM для regulatory, PostgreSQL + Oracle для DWH, Hadoop / Spark для тяжёлых ETL.

Берут ли DS-джунов?

Редко напрямую. Чаще через программу junior-аналитика рисков с возможностью роста в DS через 1–2 года.

Какие книги/курсы посмотреть?

Siddiqi «Credit Risk Scorecards», обзоры по Basel III и IFRS-9 от ЦБ и BIS, Molnar «Interpretable Machine Learning». Для corporate-направления полезно изучить методологию оценки рисков проектного финансирования.

Что особенного в работе с госконтрактами и ОПК?

Дополнительная регуляторная защищённость данных, ограниченный круг сотрудников, имеющих доступ к чувствительной информации, более длинные сроки согласования любых внешних публикаций. Готовность работать в таких условиях — must.