Собеседование на Data Scientist в Т-Банке
Содержание:
Почему Т-Банк — особенный работодатель
Т-Банк (бывший Тинькофф) — один из самых сильных DS-эмплоеров в РФ. ML внутри почти всех продуктов: скоринг, антифрод, маркетинг, голосовой ассистент Олег, инвестиции, рекомендации. Особенность — research/applied баланс, регулярные публикации в международных конференциях (NeurIPS, ICML).
DS в Т-Банке — это про A/B как религию. Все продуктовые решения проверяются экспериментально. Это сильно отличается от классического банка: ближе к технологической компании, чем к финансовой. Актуальные вакансии — на карьерной странице Т-Банка.
Информация основана на публичных источниках и опыте кандидатов. Команды Т-Банка имеют разные процессы — уточняйте у рекрутера.
Этапы собеседования
1. Скрининг с рекрутером (30-40 минут)
Стандартное знакомство. Особенности:
- Какие задачи DS решал и какой эффект (в метриках)
- Опыт A/B-тестов
- Готовность к remote-first работе (часть команд работает удалённо)
Питч 90 секунд: продукт, задача, метрика, результат.
2. Алгоритмы / coding (60-90 минут)
LeetCode Medium-Hard уровень. Не самая жёсткая планка в индустрии, но решительно отсеивают слабых:
- Алгоритмы на графах и DP
- Иногда задача на пандас или numpy
- Базовый SQL: window functions, JOIN
Подготовка: алгоритмы на собесе DS.
3. ML-теория (60-90 минут)
Глубокое погружение в основы:
- Линейные модели, логрег: вывод формул, регуляризация
- Деревья и бустинг: устройство CatBoost / LightGBM / XGBoost
- Метрики imbalanced classification (Precision @ recall, F-beta)
- Cross-validation, time-based split
- Bias-variance trade-off
Особенность Т-Банка — могут «копать» с выводом математически (производные, gradient в gradient boosting). Подготовка: bias-variance, регуляризация, boosting vs bagging.
4. A/B-тесты (45-60 минут)
Отдельный раунд. Т-Банк делает тысячи A/B в год. Вопросы:
- Расчёт sample size, MDE
- Multiple comparison корректировка (Bonferroni, BH-FDR)
- CUPED, stratification, variance reduction
- SRM check, peeking penalty
- Когда A/B нельзя — switchback, interrupted time series
Подготовка: A/B для DS, CUPED, MDE.
5. ML System Design (60-90 минут)
Сценарий:
- «Спроектируй real-time антифрод модель»
- «Сделай систему рекомендаций продуктов в приложении банка»
- «Как построишь голосовое распознавание для звонков»
Что оценивают: data → features → model → serving → monitoring → retraining. Полный pipeline, а не только Jupyter.
Подготовка: ML system design, feature engineering.
6. Поведенческое / фит
STAR-вопросы. У Т-Банка свой акцент:
- Самый сложный technical debt, который чинил
- Эксперимент, который не сработал — что вынес
- Конфликт с stakeholder — как разрешил
- Решение без полных данных
Особенности по направлениям
| Направление | Что важно |
|---|---|
| Антифрод | Real-time inference, graph features, anomaly detection, latency < 100ms |
| Кредитный скоринг | Объяснимость, монотонность фич, регулятор, Gini/KS |
| Маркетинг / CRM | Uplift modeling, propensity score, multi-armed bandits |
| Олег (ассистент) | NLP, intent classification, dialog systems |
| Инвестиции | Time-series forecasting, sentiment analysis, news NLP |
| Research | Публикации NeurIPS/ICML, deep dive в новые методы |
Что Т-Банк ценит в DS
- Экспериментальный mindset. Не «я думаю, что фича B сильнее», а «я запустил A/B и получил +2% к conversion»
- Глубокое понимание основ. Знание ML «изнутри» (как работает gradient boosting на низком уровне), а не «я использовал библиотеку»
- Бизнес-привязка. Каждая модель — про метрику и эффект. ROC-AUC сам по себе мало значит
- Готовность спорить с данными. Аргументация через числа — нормально. «Я не согласен, потому что чувствую» — слабо
- Технический фон. Production-разработка, git, CI/CD, мониторинг моделей
Как готовиться: план
- Алгоритмы Medium. LeetCode 100+ задач Python, фокус на DP и графах.
- ML-теория глубоко. Не «использовал XGBoost», а «знаю, как устроены listing-based loss, how histogram-based splits работают».
- A/B-стек. Sample size, CUPED, Bonferroni, SRM.
- ML System Design. 5-7 кейсов с упором на production-pipeline.
- Доменные кейсы. Антифрод, скоринг, RecSys, NLP — в зависимости от команды.
- STAR-истории. 6-8 готовых.
Частые ошибки
- «Я ставлю xgboost.fit() и работает». Уровень junior. Senior DS объясняет, почему gradient boosting лучше random forest на этих данных
- Игнор A/B. На вопрос «как доказал эффект модели» отвечать «по offline-метрикам» — слабо. Без A/B Т-Банк не катит
- Слабые алгоритмы. Без LeetCode дальше не идёшь, даже сильный по ML кандидат
- Не думать о production. «Обучил модель» без размышлений про latency / monitoring / retraining — слабо на ML System Design
- Шаблонные ответы. «Я использовал ROC-AUC» без обсуждения «почему именно она в этой задаче» — провал
Связанные темы
- Собеседование на Data Scientist
- Собеседование на PM в Т-Банке
- ML system design на собесе DS
- A/B testing для Data Scientist
- CUPED: снижение дисперсии в A/B
FAQ
Сколько раундов в Т-Банке для DS?
Обычно 5-6: рекрутер → coding → ML-теория → A/B → ML system design → фит. Срок 3-6 недель.
Нужны ли публикации для research-команд?
Желательно, но не строго. Для applied-команд — нет.
Берут ли в Т-Банк junior DS?
Да, через стажировки и Tinkoff Education. Сильный конкурс.
Как Т-Банк отличается от Сбера?
Т-Банк — ближе к технокомпании: A/B, продуктовое мышление, прозрачные процессы. Сбер — больше корпорат, больше compliance.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.