Собеседование на Data Scientist в ПСБ
Содержание:
Почему ПСБ — особенный работодатель для DS
ПСБ (Промсвязьбанк) — один из крупнейших российских системно-значимых банков, исторически с сильной позицией в корпоративном обслуживании и обслуживании ОПК / государственных контрактов. В последние годы — активное расширение в розничном направлении. Для Data Scientist это среда с уникальной комбинацией: классический банкинг с retail-сегментом плюс серьёзная корпоративная аналитика с очень крупными контрактами и сложной структурой клиентов. Технологически ПСБ следует общеотраслевому стандарту: упор на интерпретируемые модели, regulatory compliance, аккуратную validation-функцию.
ML-домены: кредитный скоринг (PD/EAD/LGD для retail и corporate), антифрод в транзакциях и заявках, AML / KYC-аналитика, churn prediction для розничных продуктов, customer LTV и cross-sell, корпоративная риск-аналитика (большая часть бизнеса ПСБ), NLP на текстах обращений и документов, маркетинг-DS. Стек: Python, scikit-learn, CatBoost, R для regulatory-моделей, PostgreSQL, Oracle для core-banking, Hadoop / Spark, Airflow, MLflow.
Актуальные вакансии — на hh.ru и сайте ПСБ.
Информация основана на публичных источниках и опыте кандидатов. Команды ПСБ используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл 4–6 недель и включает 5–6 этапов. Процесс корпоративный, ближе к большим традиционным банкам. Серьёзная validation-функция означает дополнительные проверки для middle+ позиций.
1. HR-скрининг (30–45 минут)
Рекрутер проверяет: production-опыт DS (1.5+ года), причины смены работы, ожидания, готовность работать с государственным и корпоративным сегментом. Опыт в banking-scoring, антифроде, AML — большой плюс.
2. Тестовое задание (3–7 дней)
Часто даётся: датасет с историей кредитов или транзакций, нужно построить скоринг или модель fraud. Особенность — высокие требования к chronological валидации и обоснованию выбора метрики под бизнес-задачу.
3. ML / DS-теория (60–90 минут)
С senior DS из команды. Темы: классика (логистическая регрессия, GLM, бустинги, regularization, calibration), метрики (Gini, KS, PSI, lift), survival для churn, основы IFRS-9 и Basel-методологии, причинно-следственный анализ. Доп. блок для corporate — портфельная аналитика и оценка концентрации.
Подготовка: Классическая ML на собесе, Метрики модели.
4. Python + SQL live-coding (60–90 минут)
Live: 1 алгоритмическая задача (LeetCode Medium), 1–2 на pandas, 1–2 на SQL по банковским данным. SQL на PostgreSQL / Oracle — оконки, complex JOIN, ratio-метрики.
Подготовка: Live-coding, SQL-собес.
5. ML system design + бизнес-кейс (60–90 минут)
Кейсы: «как ты бы построил скоринг для корпоративного кредита», «как обнаружить fraud в крупных транзакциях», «как сегментировать корпоративных клиентов для cross-sell». Сильные ответы — где обсуждаются интерпретация, regulatory ограничения, validation-процесс.
6. Поведенческое + safety (30–45 минут)
С тимлидом и менеджером. STAR-формат. Доп. блок — проверка готовности работать с чувствительными данными (госконтракты, ОПК).
Особенности по командам
Retail Credit Scoring. PD/EAD/LGD-модели для розничных кредитов: потребкредиты, кредитные карты, ипотека. Тесная связка с risk-функцией. Подойдёт DS с background в banking-scoring.
Corporate Risk & Industrial Analytics. Главная и характерная для ПСБ команда: моделирование рисков для корпоративных клиентов, включая ОПК и крупных промышленных, оценка кредитоспособности через сочетание ML и экспертных оценок. Подойдёт senior DS с интересом к корпоративной аналитике и сложным сегментам.
Antifraud & AML. Детекция fraud в транзакциях и заявках, AML-аналитика (отмывание, подозрительные паттерны, особенно по крупным суммам корпоративных клиентов), KYC-моделирование. Mix классики, графовых подходов, NLP. Регуляторно-жёсткая зона ответственности.
Churn & Retention (Retail). Прогноз ухода клиента по продуктам, реактивация спящих.
Marketing & Acquisition. Атрибуция, прогноз ROI кампаний, скоринг лидов, оптимизация креативов.
Capital & Stress-testing. Меньше команда, но важная: моделирование portfolio в стрессовых сценариях, оценка достаточности капитала, Basel-аналитика.
Validation & Model Risk Management. «Вторая линия защиты» — валидация всех моделей перед раскаткой, мониторинг в продакшене, регуляторное взаимодействие. В ПСБ серьёзная зона, особенно для регуляторно-значимых моделей.
Defence Sector Analytics. Уникальная для ПСБ команда: моделирование рисков по ОПК-сегменту и государственным контрактам, оценка кредитоспособности оборонных предприятий. Доступ к данным сильно регулируется, работа требует соответствующих допусков.
Mortgage Analytics. Меньше команда: скоринг под ипотеку, прогноз prepayment, оптимизация цены. Особенность ипотеки — длинный горизонт и низкая частота дефолтов делают модели менее «динамичными», чем в обычном потребкредитовании.
Что ПСБ ценит в DS
Глубина в banking-scoring. Strong: «обучил CatBoost scorecard на 800k retail-заявок, calibration через isotonic, monotone constraints на возраст и доход, KS 35 в out-of-time, бизнес-эффект — +3.5pp approval rate без роста NPL за 6 месяцев». Цифры обязательны.
Опыт работы с регулятором. Понимание Basel, IFRS-9, требований ЦБ — must для middle+.
Интерпретируемость моделей. Black-box не пройдёт validation-функцию. SHAP, monotone constraints, PSI-мониторинг — стандарт.
Готовность к корпоративной структуре. ПСБ — большой банк с формальными процессами. Способность работать в них — критично.
Аккуратность. Validation-функция ПСБ серьёзная, и каждый шаг моделирования будет проверен. Кандидат, у которого notebook чистый и каждое решение обоснованно, выделяется.
Знание корпоративного сегмента. Если ты хочешь в команду Corporate Risk, готовь хотя бы один кейс на корпоративную аналитику.
Долгосрочное мышление и validation-готовность. В ПСБ validation-функция найдёт каждое слабое место в моделировании. Strong-кандидат заранее обсуждает chronological split, out-of-time валидацию, обоснование выбора метрики под бизнес-задачу, план мониторинга смещений и переобучения. Долгосрочное мышление о жизни модели в проде ценится выше «голой» метрики.
Зрелость в коммуникации. Банк — это много стейкхолдеров: risk, продукт, юристы, аудит, регулятор. На собесе проверяют способность объяснить модель не-тех аудитории и работать в формальных процессах согласования. STAR-истории про конфликт с другими командами и успешное разрешение — must-prepare для middle+.
Как готовиться: план
Минимум 6–8 недель. Неделя 1–2: ML-теория (классика, GLM, бустинги, calibration). Неделя 3: LeetCode + pandas (40 задач). Неделя 4: SQL — оконки, complex JOINs. Неделя 5: banking-scoring (scorecard, IFRS-9, Basel basics). Неделя 6: A/B и interpretability. Неделя 7: ML system design — 4 кейса (retail-scoring, corporate-risk, antifraud, AML). Неделя 8: mock-интервью.
Для тренировки реальных вопросов с DS-собесов — открывай Карьерник: 1500+ задач по SQL, Python, A/B-тестам, статистике, продуктовой аналитике и ML по темам и сложности.
Частые ошибки
Первая — слабое понимание corporate-сегмента. Это половина бизнеса ПСБ, и кандидат, фокусирующийся только на retail, теряет важное преимущество.
Вторая — black-box модель без интерпретации. Validation в ПСБ серьёзная, и black-box не пройдёт.
Третья — игнорирование regulatory-стороны. Без знания Basel, IFRS-9, требований ЦБ — gap.
Четвёртая — нет цифр в кейсах. На вопрос про самый успешный проект сильный ответ с конкретными метриками — approval rate, NPL, capital adequacy.
Пятая — слабая аккуратность процесса. Validation-функция найдёт каждую слабость в твоей валидации модели. Готовь chronological split, out-of-time validation, обоснование выбора метрики.
Шестая — попытка работать «вне процесса». В ПСБ согласование любого изменения модели проходит через формальные стадии validation, governance, compliance. Кандидат, привыкший к гибким процессам стартапа, столкнётся с серьёзными ограничениями. Готовность к процессной работе — критично.
Седьмая — недооценка важности specifically corporate-аналитики. ПСБ исторически сильно corporate-ориентирован, и кандидат, фокусирующийся только на retail, упускает половину разговора с интервьюером.
Связанные темы
- Собеседование на Data Scientist в Открытии
- Собеседование на Data Scientist в Совкомбанке
- Собеседование на аналитика в ПСБ
- Собеседование на Data Scientist — гайд
FAQ
Сколько этапов в собесе DS в ПСБ?
5–6 этапов: HR-скрининг, тестовое задание, ML / DS-теория, Python + SQL live-coding, ML system design + бизнес-кейс, поведенческое + safety. Цикл — 4–6 недель.
Нужен ли опыт в банке?
Желателен, особенно если идёшь в risk-функцию. Готовность учить banking-scoring basics, IFRS-9, Basel — must.
Чем DS в ПСБ отличается от DS в Сбере?
ПСБ меньше по размеру, но имеет уникальные corporate / industrial / ОПК-сегменты. Сбер — больше по retail-объёму и шире по продуктам, плюс отдельная сильная AI-команда.
Какой английский нужен?
B1–B2 минимум. Документация и часть инструментов на английском.
Сколько платят DS в ПСБ?
Зависит от грейда. Для middle DS — на уровне крупных банков РФ (Сбер / ВТБ / Открытие), для senior — выше. Corporate Risk и AML команды обычно платят на премиум-грейде из-за специфики и регуляторной ответственности.
Какой стек чаще встречается?
Python + scikit-learn + CatBoost для retail-задач, R + GLM для regulatory, PostgreSQL + Oracle для DWH, Hadoop / Spark для тяжёлых ETL.
Берут ли DS-джунов?
Редко напрямую. Чаще через программу junior-аналитика рисков с возможностью роста в DS через 1–2 года.
Какие книги/курсы посмотреть?
Siddiqi «Credit Risk Scorecards», обзоры по Basel III и IFRS-9 от ЦБ и BIS, Molnar «Interpretable Machine Learning». Для corporate-направления полезно изучить методологию оценки рисков проектного финансирования.
Что особенного в работе с госконтрактами и ОПК?
Дополнительная регуляторная защищённость данных, ограниченный круг сотрудников, имеющих доступ к чувствительной информации, более длинные сроки согласования любых внешних публикаций. Готовность работать в таких условиях — must.