Собеседование на Data Scientist в ВТБ

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему ВТБ — особенный работодатель для DS

ВТБ — второй по активам банк РФ. DS используется в кредитном скоринге, антифроде, рекомендациях продуктов, NPS-аналитике, NLP для классификации обращений в поддержку. Команды распределены: есть core-аналитика (риски), есть digital-команда (мобильное приложение, ML на онбординге), есть отдельный R&D-кластер.

Особенность: enterprise-структура с длинным циклом согласования модели в продакшен (риск-комитет, compliance, IT-безопасность). DS обязан уметь объяснять модель не только техлиду, но и риск-аналитику без ML-бэкграунда. Актуальные позиции — на странице карьеры ВТБ.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30 минут)

Опыт, мотивация. Специфика ВТБ:

  • Был ли опыт в финтех / банке
  • Знание классического ML
  • Готовность к enterprise-темпу

2. SQL и Python (45-60 минут)

SQL базовый-middle. Python — pandas, sklearn.

3. ML-теория (60-90 минут)

Темы:

  • Classical ML: LR, GBM, ансамбли
  • Несбалансированные классы (default rate 1-3%)
  • Метрики: AUC, KS, Gini, F1
  • Calibration
  • NLP базовый: классификация, эмбеддинги (для обработки обращений)
  • Interpretability (SHAP)

4. ML system design (60 минут)

«Спроектируй модель скоринга», «classification обращений в support», «детекция fraud», «churn для премиум-сегмента».

5. Поведенческое + работа со стейкхолдерами (45-60 минут)

STAR-вопросы. ВТБ ценит зрелость в общении с риск- и compliance-командами.

6. Финал с лидом

Стратегический разговор.

Что ВТБ ценит в DS

  • Classical ML. Gradient boosting, logistic regression — основа.
  • Compliance-mindset. Знание 152-ФЗ, инструкций ЦБ.
  • Interpretability. SHAP, business-friendly объяснения.
  • Стейкхолдер-навык. Работа с риск-аналитикой, compliance.
  • Стабильность моделей. В продакшене модель работает годами — устойчивость важнее SOTA.

Типичные задачи и кейсы

  • «Спроектируй модель скоринга для новой кредитной карты»
  • «Доля fraud 0,5%. Метрики? Как обучать?»
  • «Премиум-клиенты уходят. Гипотезы, фичи, модель»
  • «NLP-классификация обращений в поддержку: как обучить, как мерить»
  • «Текущая модель работает 2 года, drift есть, retrain — когда и как»
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. Classical ML. GBM глубоко.
  2. Несбалансированные данные. Sampling, class weights, threshold tuning.
  3. Метрики classification. AUC, KS, lift, Gini, F1, calibration.
  4. NLP базовый. TF-IDF, эмбеддинги, классификация.
  5. Survival. Для LTV / время до дефолта.
  6. Causal inference. CUPED, uplift.

Частые ошибки

  • Зубрить SOTA deep learning. В банке classical ML обычно лучше: интерпретируемее, стабильнее.
  • Игнорировать model drift. Скоринг с 2022-го мог потерять качество. Нужен monitoring и retrain plan.
  • Не учитывать compliance. Скоринг без интерпретируемости в банке не пройдёт.
  • Слабая SQL. Базовый-middle обязателен.

Связанные темы

FAQ

Сколько этапов в собеседовании на DS в ВТБ?

Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 3-5 недель.

Нужен ли deep learning?

В core-командах нет. В NLP / computer vision команд — да.

Спрашивают ли survival analysis?

Для команд риска и LTV — да.

Какой уровень SQL ожидается?

Базовый-middle.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.