Собеседование на Data Scientist в ЮKassa

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему ЮKassa — особенный работодатель для DS

ЮKassa — крупный российский эквайринговый сервис (B2B-payment-platform), часть экосистемы ЮMoney / Сбера. Основной продукт — приём платежей для интернет-магазинов и сервисов: API-интеграция, обработка карточных и P2P-платежей, диспуты, чарджбэки, аналитика для merchant'ов. Для Data Scientist это нишевый и интересный сегмент: B2B-payment-аналитика, где клиентами выступают сотни тысяч торговых точек, и DS работает на стыке payment-fraud, merchant-аналитики, anti-money-laundering и продуктовой персонализации.

ML-домены: антифрод в card-not-present-транзакциях (главная и регуляторно-чувствительная зона), merchant-classification (правильный MCC-код, оценка профиля бизнеса), churn merchant'ов (отказ от использования сервиса), customer LTV для merchants, прогноз chargeback-риска, recommendation продуктов ЮKassa для разных типов магазинов, оптимизация диспутных процессов, NLP на текстах обращений. Стек: Python, scikit-learn, CatBoost, PyTorch для графовых задач, ClickHouse, PostgreSQL, Kafka для real-time, Hadoop / Spark для аналитики, Airflow, MLflow.

Актуальные вакансии — на hh.ru и сайте ЮKassa.

Информация основана на публичных источниках и опыте кандидатов. Команды ЮKassa используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

Цикл 4–6 недель и включает 5–6 этапов. Процесс структурированный, ближе к крупным финтех-компаниям.

1. HR-скрининг (30–45 минут)

Рекрутер проверяет: production-опыт DS (1.5+ года), причины смены, ожидания. Опыт в payment, эквайринге, антифроде — большой плюс. Опыт в B2B-аналитике (sales, merchants) — отдельный плюс. Готовь питч 60–90 секунд про предыдущие проекты с акцентом на B2B-сторону и понимание трафика мерчантов.

2. Тестовое задание (3–7 дней) (опционально)

Часто даётся: датасет с транзакциями или с merchant-метриками, нужно построить модель fraud, chargeback-prediction или сегментации магазинов. Сильные кандидаты обсуждают real-time inference и специфику B2B (мало клиентов, но каждый ценный). Особенность ЮKassa — обращай внимание на merchant-side metrics в тестовом: не только клиентский fraud-rate, но и доля approved-транзакций для каждого мерчанта, потеря оборота при false-positives. Бизнес-интерпретация результата ценится высоко.

3. ML / DS-теория (60–90 минут)

С senior DS из команды. Темы: классика (бустинги, регуляризация, метрики, calibration), graph ML, survival для churn, sampling для несбалансированных классов, time-series для прогноза транзакционного трафика. Доп. блок — payment-network mechanics: разница между acquirer, issuer, payment network (Visa / MasterCard / МИР / СБП), interchange fee, dispute lifecycle. Без понимания этих основ кандидат выглядит сыро.

Подготовка: Классическая ML на собесе, Метрики модели.

4. Python + SQL live-coding (60–90 минут)

Live: 1–2 алгоритмические задачи (LeetCode Medium), 1–2 на pandas / SQL по платёжным данным. SQL — оконки, ratio, time-window JOIN. Типичные задачи — найти топ-N мерчантов по chargeback-rate за последние 30 дней с условием минимального объёма, посчитать долю approved-транзакций по типу карты и стране эмитента, выявить мерчантов с резко изменившимся профилем активности через rolling windows.

Подготовка: Live-coding, SQL-собес.

5. ML system design + бизнес-кейс (60–90 минут)

Кейсы: «как ты бы построил real-time антифрод для card-not-present», «как сегментировать магазины-партнёры», «как прогнозировать chargeback-риск». Сильные ответы — где обсуждаются latency, cost-sensitive learning, merchant-сторона задачи. Особенность ЮKassa — много вопросов на интерфейс между банк-эквайрером, платёжной системой и магазином, поэтому system design должен включать схему обмена сигналами с разными участниками транзакционного flow.

6. Поведенческое (30–45 минут)

С тимлидом и менеджером. STAR-формат. Особенность ЮKassa — много вопросов про работу с B2B-клиентами и кросс-функциональную работу. Готовь STAR-истории про разрешение конфликта между бизнес-требованиями нескольких мерчантов, балансом между скоростью разработки и quality, работу с операционным центром при инцидентах.

Особенности по командам

Real-time Antifraud (Card-not-present). Главная и характерная для эквайринга команда: real-time детекция fraud в card-not-present транзакциях, balanced false-positive / false-negative с учётом B2B-merchant-стороны (false-positive = недовольный мерчант, потеря). Mix классики и graph-подходов. Подойдёт DS с real-time / fraud-background.

Merchant Analytics. Уникальная для эквайринга команда: классификация мерчантов по MCC, прогноз churn мерчанта, оценка LTV merchant'а, сегментация по объёмам и категориям. Сильно B2B-ориентированная аналитика.

Chargeback Prediction & Dispute Optimization. Меньше команда: прогноз риска chargeback по транзакции, оптимизация диспутных процессов (когда оспаривать chargeback), NLP на диспутных документах.

AML / KYC for Merchants. Регуляторная зона: проверка мерчантов на соответствие AML-требованиям, мониторинг подозрительной активности.

Customer Acquisition & Marketing. Атрибуция, скоринг merchant-лидов, оптимизация маркетинговых каналов для B2B-привлечения.

Product Recommendation. Рекомендации продуктов ЮKassa для разных типов мерчантов: оплата картами, СБП, рассрочки, B2B-инвойсы.

Settlement & Operations Analytics. Аналитика settlement-cycles, оптимизация графика выплат мерчантам, прогноз нагрузки на платёжный стек, обнаружение аномалий в reconciliation.

Pricing & Commission Optimization. Меньше команда, но влиятельная: оптимизация тарифной сетки эквайринга, прогноз эффекта изменения комиссии на retention мерчантов, A/B-эксперименты с pricing.

SME Risk & Credit. Уникальная команда вокруг кредитных продуктов для мерчантов: BNPL для покупателей через merchant'ов, оценка кредитоспособности мерчанта под short-term-финансирование, прогноз возврата займов на основе платёжной истории.

Что ЮKassa ценит в DS

Понимание B2B-payment-специфики. Strong: «обучил CatBoost для chargeback-prediction на 5М транзакций, time-based валидация по MCC-кодам и квартилям объёма мерчантов, business-aware cost-sensitive (FN = $20, FP = -$2 потерянного объёма); в A/B на 25% трафика за 30 дней chargeback rate -1.8pp с минимальным влиянием на approval rate». Цифры обязательны.

Real-time mindset. Inference в мисс-секунды.

Merchant-orientation. Эквайринг — это про мерчантов, не только про клиентов. Кандидат, думающий только о консьюмере, теряет половину задач.

Graph ML. Fraud-сети особенно в card-not-present часто переплетают карты, IP, устройства, мерчантов. Strong: graph-подходы как первый выбор.

Готовность к регулятору. AML для эквайринга — серьёзная зона.

Кросс-функциональная адекватность. Эквайринг работает с десятками тысяч мерчантов, банком-эквайером, платёжными системами (Visa, MasterCard, МИР, СБП), compliance, операционным центром. Strong-кандидат готов работать с разными типами стейкхолдеров и понимает их специфические требования.

Долгосрочное мышление. Эквайринг — это длинные клиентские отношения с мерчантами. Strong-кандидат сразу обсуждает retention-стратегии, переобучение моделей под новые типы транзакций и план monitoring.

Понимание payment-network mechanics. Знание разницы между Visa / MasterCard / МИР / СБП, interchange-fee структуры, dispute-mechanics — must для middle+. Кандидат, обсуждающий payment-задачи без знания этих основ, выглядит сыро.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

Минимум 5–7 недель. Неделя 1–2: ML-теория (классика, бустинги, graph ML basics). Неделя 3: LeetCode + pandas (50 задач). Неделя 4: SQL — оконки, time-window joins. Неделя 5: real-time fraud, B2B-аналитика. Неделя 6: ML system design — 4 кейса (real-time fraud, merchant-segmentation, chargeback, AML). Неделя 7: mock-интервью.

Для тренировки реальных вопросов с DS-собесов — открывай Карьерник: 1500+ задач по SQL, Python, A/B-тестам, статистике, продуктовой аналитике и ML по темам и сложности.

Частые ошибки

Первая — игнорирование B2B-стороны. Эквайринг — это в первую очередь B2B, и кандидат, мыслящий только консьюмерскими паттернами, выглядит сыро.

Вторая — слабый real-time mindset.

Третья — отсутствие graph ML mindset для fraud в payment.

Четвёртая — игнорирование chargeback-задач. Это уникальная и сложная зона эквайринга, и кандидат, не знакомый с chargeback-mechanics, теряет важное преимущество.

Пятая — нет цифр в кейсах.

Шестая — попытка применять подходы из retail-banking без учёта merchant-стороны.

Связанные темы

FAQ

Сколько этапов в собесе DS в ЮKassa?

5–6 этапов: HR-скрининг, тестовое задание, ML / DS-теория, Python + SQL live-coding, ML system design + бизнес-кейс, поведенческое. Цикл — 4–6 недель.

Нужен ли опыт в эквайринге?

Желателен. Если нет — выделите 1–2 недели на изучение chargeback-mechanics, MCC-системы, card-not-present-fraud-паттернов.

Чем DS в ЮKassa отличается от DS в ЮMoney?

ЮMoney — B2C-кошелёк и переводы; ЮKassa — B2B-эквайринг для бизнесов. По задачам близко (payment, fraud, AML), но клиентский профиль другой: вместо физлиц — десятки тысяч мерчантов.

Какой английский нужен?

B1–B2 минимум, для senior — выше.

Сколько платят DS в ЮKassa?

Зависит от грейда. Для middle DS — на уровне крупных финтехов, для senior — выше. Antifraud и Merchant Analytics команды обычно платят больше из-за специфики.

Какие книги/курсы посмотреть?

По эквайрингу — материалы Visa / MasterCard по chargeback-rules и interchange-fee структуре. По real-time fraud: Stripe / PayPal статьи. По graph ML: Hamilton «Graph Representation Learning».

Берут ли DS-джунов?

Редко. Чаще middle+. Junior — через тестовое и работу в команде под наставничеством senior DS.

Какие книги/курсы посмотреть до собеса?

Hamilton «Graph Representation Learning» — для graph-подходов. Материалы Visa / MasterCard по chargeback-rules. Статьи Stripe и Adyen про эквайринг-аналитику. Для cost-sensitive learning — обзоры по imbalanced classification.

Какой стек чаще встречается?

Python + scikit-learn + CatBoost для retail-задач, PyTorch для graph и NLP, ClickHouse + PostgreSQL для аналитики, Kafka для real-time, Hadoop / Spark для тяжёлых аналитических задач.