Собеседование на Data Scientist в ВТБ
Содержание:
Почему ВТБ — особенный работодатель для DS
ВТБ — второй по активам банк РФ. DS используется в кредитном скоринге, антифроде, рекомендациях продуктов, NPS-аналитике, NLP для классификации обращений в поддержку. Команды распределены: есть core-аналитика (риски), есть digital-команда (мобильное приложение, ML на онбординге), есть отдельный R&D-кластер.
Особенность: enterprise-структура с длинным циклом согласования модели в продакшен (риск-комитет, compliance, IT-безопасность). DS обязан уметь объяснять модель не только техлиду, но и риск-аналитику без ML-бэкграунда. Актуальные позиции — на странице карьеры ВТБ.
Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.
Этапы собеседования
1. Скрининг с рекрутером (30 минут)
Опыт, мотивация. Специфика ВТБ:
- Был ли опыт в финтех / банке
- Знание классического ML
- Готовность к enterprise-темпу
2. SQL и Python (45-60 минут)
SQL базовый-middle. Python — pandas, sklearn.
3. ML-теория (60-90 минут)
Темы:
- Classical ML: LR, GBM, ансамбли
- Несбалансированные классы (default rate 1-3%)
- Метрики: AUC, KS, Gini, F1
- Calibration
- NLP базовый: классификация, эмбеддинги (для обработки обращений)
- Interpretability (SHAP)
4. ML system design (60 минут)
«Спроектируй модель скоринга», «classification обращений в support», «детекция fraud», «churn для премиум-сегмента».
5. Поведенческое + работа со стейкхолдерами (45-60 минут)
STAR-вопросы. ВТБ ценит зрелость в общении с риск- и compliance-командами.
6. Финал с лидом
Стратегический разговор.
Что ВТБ ценит в DS
- Classical ML. Gradient boosting, logistic regression — основа.
- Compliance-mindset. Знание 152-ФЗ, инструкций ЦБ.
- Interpretability. SHAP, business-friendly объяснения.
- Стейкхолдер-навык. Работа с риск-аналитикой, compliance.
- Стабильность моделей. В продакшене модель работает годами — устойчивость важнее SOTA.
Типичные задачи и кейсы
- «Спроектируй модель скоринга для новой кредитной карты»
- «Доля fraud 0,5%. Метрики? Как обучать?»
- «Премиум-клиенты уходят. Гипотезы, фичи, модель»
- «NLP-классификация обращений в поддержку: как обучить, как мерить»
- «Текущая модель работает 2 года, drift есть, retrain — когда и как»
Как готовиться: план
- Classical ML. GBM глубоко.
- Несбалансированные данные. Sampling, class weights, threshold tuning.
- Метрики classification. AUC, KS, lift, Gini, F1, calibration.
- NLP базовый. TF-IDF, эмбеддинги, классификация.
- Survival. Для LTV / время до дефолта.
- Causal inference. CUPED, uplift.
Частые ошибки
- Зубрить SOTA deep learning. В банке classical ML обычно лучше: интерпретируемее, стабильнее.
- Игнорировать model drift. Скоринг с 2022-го мог потерять качество. Нужен monitoring и retrain plan.
- Не учитывать compliance. Скоринг без интерпретируемости в банке не пройдёт.
- Слабая SQL. Базовый-middle обязателен.
Связанные темы
- Собеседование на DS в Т-Банке
- Собеседование на DS в Sber AI
- Собеседование на DS в Альфа-Банке
- Accuracy vs F1
- AUC ROC простыми словами
FAQ
Сколько этапов в собеседовании на DS в ВТБ?
Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 3-5 недель.
Нужен ли deep learning?
В core-командах нет. В NLP / computer vision команд — да.
Спрашивают ли survival analysis?
Для команд риска и LTV — да.
Какой уровень SQL ожидается?
Базовый-middle.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.