13 мая 2026 г.·4 мин чтения

Собеседование на Data Scientist в ВТБ

Проверь себя · 1/3разбор после ответа

В A/B тесте всего по 25 пользователей на группу, конверсия 0/25 в контроле и 2/25 в варианте. Какой подход к проверке разницы долей обычно более аккуратен при такой малой выборке?

Содержание:

Почему ВТБ — особенный работодатель для DS
Этапы собеседования
Что ВТБ ценит в DS
Типичные задачи и кейсы
Как готовиться: план
Частые ошибки
Связанные темы
FAQ

Почему ВТБ — особенный работодатель для DS

ВТБ — второй по активам банк РФ. DS используется в кредитном скоринге, антифроде, рекомендациях продуктов, NPS-аналитике, NLP для классификации обращений в поддержку. Команды распределены: есть core-аналитика (риски), есть digital-команда (мобильное приложение, ML на онбординге), есть отдельный R&D-кластер.

Особенность: enterprise-структура с длинным циклом согласования модели в продакшен (риск-комитет, compliance, IT-безопасность). DS обязан уметь объяснять модель не только техлиду, но и риск-аналитику без ML-бэкграунда. Актуальные позиции — на странице карьеры ВТБ.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30 минут)

Опыт, мотивация. Специфика ВТБ:

Был ли опыт в финтех / банке
Знание классического ML
Готовность к enterprise-темпу

2. SQL и Python (45-60 минут)

SQL базовый-middle. Python — pandas, sklearn.

3. ML-теория (60-90 минут)

Темы:

Classical ML: LR, GBM, ансамбли
Несбалансированные классы (default rate 1-3%)
Метрики: AUC, KS, Gini, F1
Calibration
NLP базовый: классификация, эмбеддинги (для обработки обращений)
Interpretability (SHAP)

4. ML system design (60 минут)

«Спроектируй модель скоринга», «classification обращений в support», «детекция fraud», «churn для премиум-сегмента».

5. Поведенческое + работа со стейкхолдерами (45-60 минут)

STAR-вопросы. ВТБ ценит зрелость в общении с риск- и compliance-командами.

6. Финал с лидом

Стратегический разговор.

Что ВТБ ценит в DS

Classical ML. Gradient boosting, logistic regression — основа.
Compliance-mindset. Знание 152-ФЗ, инструкций ЦБ.
Interpretability. SHAP, business-friendly объяснения.
Стейкхолдер-навык. Работа с риск-аналитикой, compliance.
Стабильность моделей. В продакшене модель работает годами — устойчивость важнее SOTA.

Типичные задачи и кейсы

«Спроектируй модель скоринга для новой кредитной карты»
«Доля fraud 0,5%. Метрики? Как обучать?»
«Премиум-клиенты уходят. Гипотезы, фичи, модель»
«NLP-классификация обращений в поддержку: как обучить, как мерить»
«Текущая модель работает 2 года, drift есть, retrain — когда и как»

Готовься к собесу аналитика как в Duolingo

10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram

Открыть Карьерник в Telegram

Как готовиться: план

Classical ML. GBM глубоко.
Несбалансированные данные. Sampling, class weights, threshold tuning.
Метрики classification. AUC, KS, lift, Gini, F1, calibration.
NLP базовый. TF-IDF, эмбеддинги, классификация.
Survival. Для LTV / время до дефолта.
Causal inference. CUPED, uplift.

Частые ошибки

Зубрить SOTA deep learning. В банке classical ML обычно лучше: интерпретируемее, стабильнее.
Игнорировать model drift. Скоринг с 2022-го мог потерять качество. Нужен monitoring и retrain plan.
Не учитывать compliance. Скоринг без интерпретируемости в банке не пройдёт.
Слабая SQL. Базовый-middle обязателен.

Связанные темы

FAQ

Сколько этапов в собеседовании на DS в ВТБ?

Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 3-5 недель.

Нужен ли deep learning?

В core-командах нет. В NLP / computer vision команд — да.

Спрашивают ли survival analysis?

Для команд риска и LTV — да.

Какой уровень SQL ожидается?

Базовый-middle.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.