Собеседование на Data Scientist в ЦФТ
Содержание:
Почему ЦФТ — особенный работодатель для DS
ЦФТ (Центр Финансовых Технологий) — один из ведущих российских разработчиков банковского ПО и процессинговых решений: АБС (автоматизированные банковские системы), процессинг карт, платёжные шлюзы, антифрод-системы для банков. По бизнесу — это B2B-вендор для финансовой индустрии: клиенты ЦФТ — десятки банков и финансовых организаций РФ. Для Data Scientist это особенная среда: вместо одной финансовой организации со своими данными работаешь над продуктовыми ML-решениями, которые потом используются множеством банков. Это даёт серьёзную глубину в технологиях и архитектуре, но требует понимания регуляторной специфики разных банков.
ML-домены: продуктовые ML-решения для AML-комплайенса (модули для банков-клиентов), fraud-detection как продукт (real-time engines для банков), card-processing analytics, скоринговые библиотеки и фреймворки для retail-кредитования, recommendation для b2b-клиентов ЦФТ, performance-аналитика процессингового стека. Стек: Python, scikit-learn, CatBoost, PyTorch, Hadoop / Spark, Greenplum, Oracle, PostgreSQL, Kafka, Airflow, MLflow.
Актуальные вакансии — на hh.ru и сайте ЦФТ.
Информация основана на публичных источниках и опыте кандидатов. Команды ЦФТ используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл 4–6 недель и включает 5–6 этапов. Процесс структурированный, инжиниринг-ориентированный — ЦФТ это в первую очередь технологическая компания.
1. HR-скрининг (30–45 минут)
Рекрутер проверяет: production-опыт DS (1.5+ года), причины смены, ожидания, готовность работать в b2b-продуктовой среде. Опыт в банковском ПО, payment-процессинге, fraud — большой плюс.
2. Тестовое задание (3–7 дней)
Часто даётся: задача по продуктовому ML-модулю (например, прототип antifraud-движка или скоринговая библиотека). Сильные кандидаты делают чистый и хорошо структурированный код, обсуждают модулярность и API-дизайн. Особенность ЦФТ — высокий стандарт по engineering: сдача включает не только notebook, но и Python-package с тестами, документацией и examples. Это вендорский продукт, и DS обязан писать код, который потом передаётся другим engineers без полного переписывания.
3. ML / DS-теория (60–90 минут)
С senior DS из команды. Темы: классика (бустинги, регуляризация, метрики, calibration), graph ML, banking-scoring fundamentals, AML/KYC-моделирование, NLP. Доп. блок: построение reusable ML-фреймворков и production-quality-кода.
Подготовка: Классическая ML на собесе.
4. Python + SQL live-coding (60–90 минут)
Live: 1–2 алгоритмические задачи (LeetCode Medium), 1–2 на pandas / SQL. Особенность ЦФТ — больший акцент на чистоту кода (это вендорский продукт): структура, тестируемость, документация.
Подготовка: Live-coding, SQL-собес.
5. ML system design + product engineering (60–90 минут)
Кейсы: «спроектируй antifraud-движок, который будет использоваться разными банками», «как ты бы построил скоринговую библиотеку для retail-кредитов как переиспользуемый модуль», «как обеспечить интерпретируемость и аудит моделей для банков-клиентов». Сильные ответы — где обсуждаются modular design, API, configurability, мониторинг, observability, обратная совместимость API при апгрейде версий, deployment-стратегии для on-premise vs cloud-инсталляций.
6. Поведенческое + b2b-mindset (30–45 минут)
С тимлидом и менеджером. STAR-формат. Дополнительно — проверка готовности работать с b2b-клиентами и их требованиями. Типичные вопросы — как ты бы разрешил конфликт между требованиями двух разных банков-клиентов с противоположными приоритетами, как объяснил техническое решение non-technical стейкхолдеру банка-клиента, что бы делал, если model в проде у банка-клиента деградировала. Готовь STAR-истории про работу в b2b или sales engineering роли.
Особенности по командам
Antifraud Engines (B2B Product). Главная и характерная для ЦФТ команда: разработка real-time antifraud-движков как продукта для банков. Mix классики и графовых подходов с упором на configurability (банки-клиенты должны настраивать модель под свою специфику). Подойдёт DS с интересом к product engineering и opensource-стилю работы.
AML Compliance Solutions. Регуляторные ML-модули для банков: суспициозные операции, KYC-скоринг, мониторинг патернов. Тесная связка с регуляторной частью продукта.
Credit Scoring Libraries. Разработка переиспользуемых скоринговых модулей: WOE-binning, scorecard auto-development, PSI-мониторинг как стандартные фичи продукта.
Card-Processing Analytics. Аналитика процессингового стека: оптимизация маршрутизации транзакций, прогноз peak loads, capacity planning.
ML Platform & Infrastructure. Меньше команда: построение ML-фреймворков для внутренней разработки и для b2b-клиентов, deployment-pipelines, monitoring.
R&D & New Products. Исследовательская команда: новые продуктовые направления (например, NLP для документооборота банков, embedded-аналитика в АБС).
B2B Sales Support & Pre-Sales Analytics. Уникальная для ЦФТ команда: создание demo-сценариев и PoC для пресейл-этапа продаж банкам, бенчмарки решений ЦФТ против конкурентов, custom-аналитика по запросу крупного банка-клиента. Подойдёт DS с интересом к sales engineering.
Customer Success Analytics. Аналитика использования продуктов ЦФТ банками-клиентами: предсказание churn-риска клиента, выявление under-utilization, рекомендации дополнительных модулей. Тесная связка с customer success-командой.
Documentation & Knowledge Engineering. Меньше команда: NLP-решения для разбора и индексации регуляторной документации, поиск по большой базе нормативных актов ЦБ, automated knowledge extraction.
Что ЦФТ ценит в DS
Engineering excellence. ЦФТ — это в первую очередь технологическая компания, и DS обязан писать чистый, тестируемый, документированный код. Strong: «реализовал antifraud-модуль на CatBoost с конфигурируемыми правилами через JSON, latency 95p < 70ms, покрыт unit-тестами на 85%; в pilot-deployment у банка-клиента fraud rate -2pp при минимальном изменении false-positives». Цифры + engineering обязательны.
B2B-mindset. Решения продаются банкам. Кандидат, мыслящий категориями «одного клиента», теряет важное преимущество. Strong: обсуждение, как сделать модель configurable под разные банки.
Глубина в banking-domain. Понимание banking-фундамента (скоринг, AML, payment) — must. ЦФТ не обучает банкингу.
Modular design. Не «обучи модель», а «построй переиспользуемый ML-модуль». Это другой mindset.
Готовность к долгим циклам. B2B-вендор — это долгие циклы релизов, серьёзные регрессии, обратная совместимость API. Кандидат, привыкший к быстрому стартапному циклу, будет страдать.
Кросс-функциональная адекватность с банками-клиентами. ЦФТ работает с десятками банков, у каждого свои требования и темпы внедрения. Готовность участвовать в pre-sales-разговорах, объяснять решения старшим стейкхолдерам банка-клиента, документировать продукт — критично.
Сильные коммуникационные навыки. Часть работы — взаимодействие с продуктовыми менеджерами разных банков-клиентов, customer success-командой, sales engineering. Для middle+ — навык писать понятную техническую документацию обязателен.
Понимание долгого жизненного цикла продукта. ЦФТ-решения внедряются у банков на годы. Strong-кандидат сразу обсуждает план поддержки моделей, миграции, версионирования и обратной совместимости API.
Как готовиться: план
Минимум 6–8 недель. Неделя 1–2: ML-теория (классика, graph ML, banking-scoring fundamentals). Неделя 3: чистый Python — pytest, type hints, architecture. Неделя 4: SQL — оконки, complex JOINs. Неделя 5: ML system design с упором на product engineering. Неделя 6: AML / fraud / scoring basics. Неделя 7: STAR-истории про работу в b2b-команде или с заказчиком. Неделя 8: mock-интервью.
Для тренировки реальных вопросов с DS-собесов — открывай Карьерник: 1500+ задач по SQL, Python, A/B-тестам, статистике, продуктовой аналитике и ML по темам и сложности.
Частые ошибки
Первая — слабый engineering. ЦФТ — это product engineering, и DS, не пишущий чистый код, не пройдёт.
Вторая — B2C-mindset. Strong-кандидат сразу обсуждает configurability и модульность.
Третья — слабый banking-фундамент. ЦФТ ожидает, что кандидат знает banking-domain до собеса.
Четвёртая — игнорирование API-дизайна. Если ты на ML system design не обсуждаешь, как другие команды будут использовать твою модель, это сигнал.
Пятая — попытка «быстрый прототип всё что угодно». В вендорском продукте долгий цикл выпуска, и engineering-rigour важнее скорости.
Связанные темы
- Собеседование на Data Scientist в Qiwi
- Собеседование на Data Scientist в ЮMoney
- Собеседование на Data Scientist в Тинькофф
- Собеседование на Data Scientist — гайд
FAQ
Сколько этапов в собесе DS в ЦФТ?
5–6 этапов: HR-скрининг, тестовое задание, ML / DS-теория, Python + SQL live-coding, ML system design + product engineering, поведенческое + b2b-mindset. Цикл — 4–6 недель.
Нужен ли опыт в банковском ПО?
Желателен, но не обязателен. Сильный опыт в product engineering плюс banking-domain знания — must.
Чем DS в ЦФТ отличается от DS в банке?
ЦФТ — вендор. Решения продаются банкам как продукт. В банке DS работает с конкретными данными и продуктом; в ЦФТ — над framework / library / engine, который будет использоваться разными банками.
Какой английский нужен?
B1–B2 минимум, для senior — выше. Документация и часть кода — двуязычная.
Сколько платят DS в ЦФТ?
Зависит от грейда. Для middle DS — на уровне крупных финтехов, для senior — выше. ML Platform и R&D команды обычно платят больше из-за инжиниринг-фокуса.
Какие книги/курсы посмотреть?
Siddiqi «Credit Risk Scorecards» — для scoring-фундамента. Hamilton «Graph Representation Learning» — для graph ML. По AML — материалы ЦБ и ACAMS. По engineering: Martin Fowler по архитектуре, Robert C. Martin «Clean Code» — стандарт для понимания, что ожидается от инженерного кода.
Берут ли DS-джунов?
Редко напрямую. Чаще middle+. Junior может зайти через тестовое и работу в команде product engineering под наставничеством senior DS.