Собеседование на Data Scientist в Сбере
Содержание:
Почему Сбер — особенный работодатель для DS
Сбер — крупнейший банк РФ + экосистема: СберAI, СберМаркет, Окко, Кинопоиск, СберCloud, СберАвто. DS-команды есть во всех направлениях, домены разные: банковский скоринг, антифрод, рекомендации, NLP (GigaChat), CV.
Стек: Python + PyTorch + scikit-learn + LightGBM + Spark + Hadoop + Hive + Greenplum. СберAI работает с large language models (GigaChat). Команда DS в банке — большая, иерархия выражена.
Актуальные вакансии — на sberbank-talents.ru.
Информация основана на публичных источниках и опыте кандидатов. Команды Сбера используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
1. HR-скрининг (30-45 минут)
Знакомство:
- Опыт ML, специфика (банк / медиа / NLP)
- Стек: PyTorch / Spark / LightGBM
- Motivation
Питч 90 секунд: задача, данные, модель, метрика, impact.
2. ML теория (60-90 минут)
- Bias-variance, регуляризация
- Бустинги (XGBoost, CatBoost, LightGBM)
- Метрики: ROC AUC, precision/recall, F1, KS
- Кросс-валидация, time-series split
Подготовка: ML-теория на собесе DS, классическая ML.
3. Python + SQL (60-90 минут)
Live coding.
- Pandas / numpy / sklearn
- SQL — feature engineering чаще в SQL
- Алгоритмы medium
Подготовка: Python для DS.
4. ML System Design (60-90 минут)
Кейсы по domain:
- Скоринг кредитных карт
- Антифрод реал-тайм
- Recommendation для СберМаркет / Окко
- NLP для саппорта / GigaChat fine-tuning
Подготовка: ML system design, feature engineering.
5. Поведенческое (45-60 минут)
Сбер ценит ownership и pragmatic подход. STAR: trade-offs, конфликты, missed deadlines, compliance situations.
Особенности по командам
Розница (Банк): скоринг кредитов и карт. Compliance, аудит.
Антифрод: real-time inference, низкая latency.
СберAI: GigaChat, LLM-инициативы, foundation models.
СберМаркет: рекомендации, ranking, dynamic pricing.
Окко / Кинопоиск: рекомендации медиа-контента, content tagging.
СберCloud: ML-сервисы для клиентов.
Что Сбер ценит в DS
- ML фундамент. Bias-variance, бустинги, метрики — must.
- SQL уверенно. Feature engineering чаще в SQL.
- Production mindset. Скоринг в проде, не notebook.
- Compliance в банке. AML, PII, 152-ФЗ.
- Domain expertise. Помогает в каждом конкретном направлении.
Как готовиться: план
За 4-6 недель:
- Неделя 1-2 — ML теория. Бустинги, метрики, KS (специфика банка). ML-теория.
- Неделя 3 — Python + SQL. Live coding. Python для DS.
- Неделя 4 — System design. Скоринг / антифрод / NLP. ML system design.
- Неделя 5 — Compliance + production. AML, PII.
- Неделя 6 — Mocks + behavioral.
Частые ошибки
- Без банковского домена. Не знаешь PD / EAD / LGD — слабо в скоринге.
- «У меня XGBoost — лучший». Без обоснования и метрик — провал.
- Игнор compliance. В Сбер банке — must.
- Слабый SQL. «Я только Python» не работает.
- Без production. Только эксперименты — спросят как deploy.
Связанные темы
- Собеседование на Data Scientist
- ML-теория на собесе DS
- Классическая ML на собесе
- ML system design
- Python для DS
- Feature engineering
FAQ
Удалёнка в Сбере для DS?
Гибрид стандарт. Полная — реже из-за compliance.
Зарплатные вилки 2026?
Middle DS: 270-400k. Senior: 400-620k. СберAI — выше из-за специфики LLM.
Английский нужен?
Не обязателен.
Сбер / СберAI — отдельные собесы?
Часто да. СберAI имеет более глубокий ML focus.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.