Собеседование на Data Scientist в Совкомбанке

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Совкомбанк — особенный работодатель для DS

Совкомбанк — один из крупнейших российских частных банков с сильной позицией в розничном кредитовании (особенно «Халва» — карта рассрочки) и регионально-широким присутствием. Совкомбанк активно инвестировал в digital и data-driven процессы за последние годы, что превратило компанию в одного из самых интересных банковских работодателей для Data Scientist на RU-рынке. Особенность — рассрочечный продукт «Халва» с уникальной экосистемой партнёрских магазинов: это даёт DS богатые данные о потребительском поведении и сложные задачи скоринга, монетизации и удержания клиентов.

ML-домены: кредитный скоринг (PD, EAD, LGD), антифрод в транзакциях и заявках, прогноз churn и реактивации спящих клиентов, customer LTV и cross-sell (Халва → POS-кредиты → ипотека), recommendation для партнёрских магазинов и категорий покупок, NLP на обращениях клиентов, AML / KYC-аналитика, маркетинг-DS (атрибуция, скоринг лидов, оптимизация креативов). Стек: Python, scikit-learn, CatBoost / XGBoost, R для regulatory-моделей, PostgreSQL, ClickHouse, Hadoop / Spark, Airflow, MLflow.

Актуальные вакансии — на hh.ru и сайте Совкомбанка.

Информация основана на публичных источниках и опыте кандидатов. Команды Совкомбанка используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

Цикл 3–5 недель и включает 4–6 этапов. Процесс корпоративный, но менее формализованный, чем у Сбера или ВТБ. Несколько технических секций, отдельная продуктовая.

1. HR-скрининг (30–45 минут)

Рекрутер проверяет: production-опыт DS (1.5+ года), причины смены работы, ожидания, интерес к банкам. Опыт в скоринге, антифроде, retail-banking — большой плюс.

2. Тестовое задание (3–5 дней)

Часто даётся: датасет с историей заявок и транзакций, нужно построить scorecard или модель fraud. Сильные кандидаты делают chronological split, обсуждают interpretability и обосновывают выбор метрики.

3. ML / DS-теория (60–90 минут)

С senior DS из команды. Темы: классика (логистическая регрессия, GLM, бустинги, regularization, calibration), метрики (Gini, KS, PSI), survival для churn, основы IFRS-9, причинно-следственный анализ.

Подготовка: Классическая ML на собесе.

4. Python + SQL live-coding (60 минут)

Live: 1 алгоритмическая задача (LeetCode Medium-Easy), 1–2 на pandas, 1–2 на SQL. SQL в Совкомбанке часто на PostgreSQL / ClickHouse — оконки, ratio, complex JOINs на больших таблицах транзакций.

Подготовка: SQL-собес.

5. ML system design + продуктовый кейс (60–90 минут)

Кейсы: «как ты бы построил скоринг для рассрочки в магазине-партнёре», «как обнаружить fraud в Халве», «как удержать клиента от ухода после первой просрочки». Сильные ответы — где обсуждаются интерпретация, регуляторное соответствие, и продуктовая логика Халвы.

6. Поведенческое (30–45 минут)

С тимлидом и менеджером. STAR-формат.

Особенности по командам

Credit Scoring & Risk. Главная команда: PD/EAD/LGD-модели для retail-кредитов и рассрочечных продуктов. Тесная связка с risk-функцией. Подойдёт DS с background в banking-scoring.

Halva / Installment Analytics. Уникальная для Совкомбанка команда вокруг карты рассрочки: моделирование поведения в партнёрской сети, оптимизация cashback и комиссий магазинов, рекомендации категорий покупок, прогноз стоимости приобретения и удержания клиента. Подойдёт DS с интересом к retail-analytics и e-commerce.

Antifraud. Детекция fraud в транзакциях, заявках, AML-аналитика. Real-time inference для cards-fraud.

Churn & Retention. Прогноз ухода клиента по продуктам, реактивация.

Customer LTV & Cross-Sell. LTV-прогноз, propensity для дополнительных продуктов (от Халвы к POS, от карты к ипотеке).

Marketing & Acquisition. Атрибуция, прогноз ROI, скоринг лидов. Активные performance-команды.

Regional Analytics. Уникальная команда: Совкомбанк сильно представлен в регионах, и аналитика по гео — отдельная задача (контент и продуктовая стратегия по регионам).

Investment Products & Wealth Analytics. Команда вокруг инвестиционных продуктов и страховых решений (Совкомбанк имеет существенный страховой бизнес): recommendation инвестпродуктов, прогноз склонности к ним, сегментация состоятельных клиентов.

Validation & Model Risk. Команда «второй линии» — валидация моделей перед раскаткой, мониторинг в продакшене, регуляторное взаимодействие. Подойдёт senior DS, готовый к работе аудитором моделей.

Operational Analytics. Меньше команда: аналитика сети офисов, оптимизация графиков работы кассиров и менеджеров, ML для распределения нагрузки в call-center. Тесная связка с операционным менеджментом.

Что Совкомбанк ценит в DS

Понимание retail-banking-специфики. Strong: «обучил CatBoost для скоринга POS-кредитов в магазинах-партнёрах, time-based валидация по сезонам и партнёрам, calibration через isotonic; в A/B на 25% потока за 60 дней approval rate +3.2pp без роста NPL; бизнес-эффект — около +X тыс. одобренных заявок в месяц». Цифры обязательны.

Гибкость и продуктовое мышление. В отличие от консервативных банков, Совкомбанк ценит DS, готовых к продуктовым экспериментам и быстрым итерациям.

Интерпретируемость моделей. SHAP, monotone constraints, PSI-мониторинг — стандарт.

Готовность к региональной специфике. Поведение клиентов в Москве и в малых городах сильно различается. Кандидат, мыслящий только централизованно, теряет важное преимущество.

Опыт A/B. В Халве плотные продуктовые эксперименты — кандидат должен говорить про эксперименты на одном уровне с интервьюером.

Понимание партнёрской экономики. Халва — это не только клиенты, но и тысячи партнёрских магазинов с разными условиями, комиссиями, продуктовыми ассортиментами. Strong-кандидат на собесе обсуждает не только клиентский скоринг, но и сегментацию партнёров: разные категории магазинов имеют разный профиль рисков и разный потенциал для оптимизации.

Кросс-функциональная адекватность. Совкомбанк — большая структура с разными уровнями зрелости команд. На собесе проверяют способность работать с risk-функцией, продуктом и партнёрской сетью одновременно. Кандидат, привыкший работать в изолированной DS-команде без коммуникации со стейкхолдерами, столкнётся с трудностями.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

Минимум 6–8 недель. Неделя 1–2: ML-теория (классика, GLM, бустинги, calibration). Неделя 3: LeetCode + pandas (40 задач). Неделя 4: SQL — оконки, ratio, complex JOINs. Неделя 5: banking-scoring basics (scorecard development, PSI). Неделя 6: A/B и retail-analytics. Неделя 7: ML system design — отработай 4 кейса (scoring, antifraud, churn, Halva-specific). Неделя 8: mock-интервью.

Для тренировки реальных вопросов с DS-собесов — открывай Карьерник: 1500+ задач по SQL, Python, A/B-тестам, статистике, продуктовой аналитике и ML по темам и сложности.

Частые ошибки

Первая — игнорирование специфики Халвы. Если ты на собесе говоришь про «обычный скоринг», но кандидат не различает retail-кредит от рассрочки в партнёрском магазине — это сигнал.

Вторая — black-box модель без интерпретации.

Третья — слабая работа с регулятором. Без понимания IFRS-9 в банке — gap.

Четвёртая — нет цифр в кейсах.

Пятая — недооценка региональной специфики. Поведение клиентов в Москве и в Сибири — сильно разное.

Шестая — попытка прямо перенести подходы из e-commerce. Banking требует другого инструментария и других ограничений. Strong-кандидат сразу обсуждает: для скоринга — scorecard development и monotone constraints, для retention — survival анализ, для fraud — real-time inference и graph-подходы. Для Халвы дополнительно — partner-сегментация и retail-economics.

Седьмая — нет понимания uniqueness Халвы как продукта. Halva совмещает банковскую часть (кредит) и retail-часть (партнёрская сеть и cashback). Кандидат, обсуждающий только одну сторону, теряет половину истории.

Связанные темы

FAQ

Сколько этапов в собесе DS в Совкомбанке?

4–6 этапов: HR-скрининг, тестовое задание, ML / DS-теория, Python + SQL live-coding, ML system design + продуктовый кейс, поведенческое. Цикл — 3–5 недель.

Нужен ли опыт в банковской аналитике?

Желателен. Если нет — выделите 2–3 недели на изучение banking-scoring basics, PD/EAD/LGD, scorecard development.

Берут ли DS-джунов?

Редко напрямую. Чаще — middle и senior. Junior может зайти через программу аналитика рисков с возможностью дорасти в DS через 1–2 года.

Чем DS в Совкомбанке отличается от DS в Тинькофф?

Размер бизнеса меньше, но особенность — Халва как уникальный rassrochечный продукт с серьёзной партнёрской сетью. Это даёт уникальные retail-analytics задачи. Тинькофф больше про быстрые продуктовые эксперименты в digital-only банкинге.

Какой английский нужен?

B1–B2 минимум. Внутренние коммуникации в основном на русском.

Сколько платят DS в Совкомбанке?

Зависит от грейда. Для middle DS — на уровне крупных банков РФ (немного ниже Тинькофф / Альфа), для senior — близко к рынку. Credit Scoring и Halva Analytics команды обычно платят выше.

Какой стек чаще встречается?

Python + scikit-learn + CatBoost — основа. R для regulatory-моделей. PostgreSQL + ClickHouse для аналитики, Hadoop / Spark для тяжёлых ETL.

Что важнее — банковский опыт или общий ML?

Для retail-команд — банковский плюс общий ML равнозначно. Для Halva-команды важнее опыт retail-analytics и продуктового мышления. Чистый общий ML без понимания банковских ограничений — gap.

Какие книги/курсы посмотреть?

Siddiqi «Credit Risk Scorecards» — для banking-scoring. По интерпретируемости: Molnar «Interpretable Machine Learning». По retail-analytics с партнёрской сетью полезно посмотреть кейсы Сбермаркета, Озона и других marketplace-игроков с большой партнёрской сетью.

Стоит ли переходить из e-commerce в Совкомбанк?

Для Halva-команды — да, переход относительно органичный (retail-логика + регуляторика). Для core-banking-команд — требуется учить banking-фундамент.