Собеседование на Data Scientist в Т-Банке

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Т-Банк — особенный работодатель

Т-Банк (бывший Тинькофф) — один из самых сильных DS-эмплоеров в РФ. ML внутри почти всех продуктов: скоринг, антифрод, маркетинг, голосовой ассистент Олег, инвестиции, рекомендации. Особенность — research/applied баланс, регулярные публикации в международных конференциях (NeurIPS, ICML).

DS в Т-Банке — это про A/B как религию. Все продуктовые решения проверяются экспериментально. Это сильно отличается от классического банка: ближе к технологической компании, чем к финансовой. Актуальные вакансии — на карьерной странице Т-Банка.

Информация основана на публичных источниках и опыте кандидатов. Команды Т-Банка имеют разные процессы — уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30-40 минут)

Стандартное знакомство. Особенности:

  • Какие задачи DS решал и какой эффект (в метриках)
  • Опыт A/B-тестов
  • Готовность к remote-first работе (часть команд работает удалённо)

Питч 90 секунд: продукт, задача, метрика, результат.

2. Алгоритмы / coding (60-90 минут)

LeetCode Medium-Hard уровень. Не самая жёсткая планка в индустрии, но решительно отсеивают слабых:

  • Алгоритмы на графах и DP
  • Иногда задача на пандас или numpy
  • Базовый SQL: window functions, JOIN

Подготовка: алгоритмы на собесе DS.

3. ML-теория (60-90 минут)

Глубокое погружение в основы:

  • Линейные модели, логрег: вывод формул, регуляризация
  • Деревья и бустинг: устройство CatBoost / LightGBM / XGBoost
  • Метрики imbalanced classification (Precision @ recall, F-beta)
  • Cross-validation, time-based split
  • Bias-variance trade-off

Особенность Т-Банка — могут «копать» с выводом математически (производные, gradient в gradient boosting). Подготовка: bias-variance, регуляризация, boosting vs bagging.

4. A/B-тесты (45-60 минут)

Отдельный раунд. Т-Банк делает тысячи A/B в год. Вопросы:

  • Расчёт sample size, MDE
  • Multiple comparison корректировка (Bonferroni, BH-FDR)
  • CUPED, stratification, variance reduction
  • SRM check, peeking penalty
  • Когда A/B нельзя — switchback, interrupted time series

Подготовка: A/B для DS, CUPED, MDE.

5. ML System Design (60-90 минут)

Сценарий:

  • «Спроектируй real-time антифрод модель»
  • «Сделай систему рекомендаций продуктов в приложении банка»
  • «Как построишь голосовое распознавание для звонков»

Что оценивают: data → features → model → serving → monitoring → retraining. Полный pipeline, а не только Jupyter.

Подготовка: ML system design, feature engineering.

6. Поведенческое / фит

STAR-вопросы. У Т-Банка свой акцент:

  • Самый сложный technical debt, который чинил
  • Эксперимент, который не сработал — что вынес
  • Конфликт с stakeholder — как разрешил
  • Решение без полных данных

Особенности по направлениям

Направление Что важно
Антифрод Real-time inference, graph features, anomaly detection, latency < 100ms
Кредитный скоринг Объяснимость, монотонность фич, регулятор, Gini/KS
Маркетинг / CRM Uplift modeling, propensity score, multi-armed bandits
Олег (ассистент) NLP, intent classification, dialog systems
Инвестиции Time-series forecasting, sentiment analysis, news NLP
Research Публикации NeurIPS/ICML, deep dive в новые методы

Что Т-Банк ценит в DS

  • Экспериментальный mindset. Не «я думаю, что фича B сильнее», а «я запустил A/B и получил +2% к conversion»
  • Глубокое понимание основ. Знание ML «изнутри» (как работает gradient boosting на низком уровне), а не «я использовал библиотеку»
  • Бизнес-привязка. Каждая модель — про метрику и эффект. ROC-AUC сам по себе мало значит
  • Готовность спорить с данными. Аргументация через числа — нормально. «Я не согласен, потому что чувствую» — слабо
  • Технический фон. Production-разработка, git, CI/CD, мониторинг моделей
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. Алгоритмы Medium. LeetCode 100+ задач Python, фокус на DP и графах.
  2. ML-теория глубоко. Не «использовал XGBoost», а «знаю, как устроены listing-based loss, how histogram-based splits работают».
  3. A/B-стек. Sample size, CUPED, Bonferroni, SRM.
  4. ML System Design. 5-7 кейсов с упором на production-pipeline.
  5. Доменные кейсы. Антифрод, скоринг, RecSys, NLP — в зависимости от команды.
  6. STAR-истории. 6-8 готовых.

Частые ошибки

  • «Я ставлю xgboost.fit() и работает». Уровень junior. Senior DS объясняет, почему gradient boosting лучше random forest на этих данных
  • Игнор A/B. На вопрос «как доказал эффект модели» отвечать «по offline-метрикам» — слабо. Без A/B Т-Банк не катит
  • Слабые алгоритмы. Без LeetCode дальше не идёшь, даже сильный по ML кандидат
  • Не думать о production. «Обучил модель» без размышлений про latency / monitoring / retraining — слабо на ML System Design
  • Шаблонные ответы. «Я использовал ROC-AUC» без обсуждения «почему именно она в этой задаче» — провал

Связанные темы

FAQ

Сколько раундов в Т-Банке для DS?

Обычно 5-6: рекрутер → coding → ML-теория → A/B → ML system design → фит. Срок 3-6 недель.

Нужны ли публикации для research-команд?

Желательно, но не строго. Для applied-команд — нет.

Берут ли в Т-Банк junior DS?

Да, через стажировки и Tinkoff Education. Сильный конкурс.

Как Т-Банк отличается от Сбера?

Т-Банк — ближе к технокомпании: A/B, продуктовое мышление, прозрачные процессы. Сбер — больше корпорат, больше compliance.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.