Собеседование на Data Engineer в QIWI
Содержание:
Почему QIWI — особенный работодатель для DE
QIWI — крупный российский fintech-провайдер: платёжные сервисы (Qiwi-кошелёк), банковский бизнес (Точка — отдельный бренд после реструктуризации), эквайринг, платежи B2C/B2B/госуслуги. После регуляторных изменений 2024 года периметр компании менялся, но QIWI остаётся одним из крупнейших платёжных провайдеров. Для Data Engineer это специфический контекст: огромный поток платёжных транзакций, real-time антифрод, серьёзный compliance ЦБ (115-ФЗ AML, ФЗ-161 о НПС).
Главные DE-домены: построение payment-DWH (миллиарды транзакций в год); pipeline для real-time антифрода (sub-second детекция мошеннических транзакций); CDC из core-биллинга в DWH; KYC и AML pipeline (115-ФЗ); pipeline для регуляторной отчётности ЦБ; pipeline для скоринга и продуктовой аналитики; biling B2B-клиентов эквайринга.
Стек: Oracle (наследие core-биллинга) + PostgreSQL + ClickHouse для real-time-аналитики + Greenplum для DWH; Kafka + Debezium для CDC; Airflow + dbt + Spark; data lake. Команда DE плотно работает с риск-функцией и compliance.
Актуальные вакансии — на hh.ru и сайте QIWI (или партнёров).
Информация основана на публичных источниках и опыте кандидатов. Периметр QIWI менялся в последние годы — формат и этапы зависят от направления, для ролей с допусками обязательна СБ, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 4-6 недель, 5-6 этапов. Процесс корпоративный с compliance-проверками: HR, техническое интервью, кодинг и SQL, архитектурный кейс, поведенческое, финал.
1. HR-скрининг (30-45 минут)
Рекрутер уточняет: production-опыт DE (от 2 лет, желательно с fintech, банковским или payment-контекстом), знание классического и real-time стека, мотивацию идти в QIWI, ожидания по компенсации и формату (Москва, гибрид). Готовь питч на 90 секунд про самый зрелый production-pipeline с цифрами.
2. Техническое интервью / SQL и архитектура (60-90 минут)
Базовая секция с senior DE из команды. Темы: SQL deep dive (оконки, оптимизация транзакционных таблиц, partitioning по времени), модели данных (event-схемы для платежей, immutable journal-таблицы), batch vs streaming (real-time для антифрода vs batch для отчётности), CDC, data quality. Специфический вопрос: «как ты бы построил real-time антифрод-pipeline на 10K транзакций в секунду с latency < 500мс».
Подготовка: SQL для DE, Kafka streaming, ClickHouse и OLAP.
3. Python + SQL live coding (60-90 минут)
Задачи прагматичные: 1-2 на SQL (оконки, JOIN, оптимизация — часто на платёжных данных), 1-2 на Python (pandas, простые ETL). Часто живой кейс: «дам тебе таблицу платежей и пользователей, найди потенциально подозрительные паттерны (резкое увеличение объёма, нетипичные направления)». Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.
Подготовка: SQL для DE.
4. Архитектурный кейс (90 минут)
Самая характерная секция. Кейс: «спроектируй real-time антифрод-pipeline с интеграцией ML-моделей», «как ты бы построил pipeline для регуляторной отчётности по 115-ФЗ», «как сделать payment-DWH с reconciliation против core-биллинга». Нужно: уточнить требования, описать архитектуру, выбрать стек, продумать idempotency и точность, заложить аудит. Сильный сигнал — учёт fintech-специфики: критичность каждой копейки, compliance, real-time-требования.
Подготовка: Airflow patterns, CDC и event sourcing.
5. Поведенческое + culture fit (45-60 минут)
С тимлидом или представителем направления. STAR-формат: конфликт с риск-командой, факап в проде (особенно с финансовыми последствиями), длинный compliance-проект.
6. Финал с руководителем + СБ (1-2 недели)
Финальная встреча: грейд, оффер. СБ-проверка для ролей с доступом к чувствительным данным.
Особенности по командам
Payment-DWH и core-биллинг. Команда строит payment-DWH: транзакции, остатки, балансовая отчётность. Стек — Greenplum + Oracle + Airflow + dbt + Kafka. Челлендж — точность (каждая копейка должна сходиться), reconciliation с core-биллингом, регуляторные требования. Подойдёт DE с financial-DWH или payment-фоном.
Real-time антифрод. Команда строит real-time pipeline антифрода: events транзакций → ML-модели → решение «approve/decline» за миллисекунды. Стек — Kafka + Redis + кастомные стриминговые сервисы + ClickHouse для feature lookup. Челлендж — sub-second latency, exactly-once, fallback на rule-based при деградации ML. Подойдёт DE с background в стримах.
KYC и AML compliance. Команда работает с pipeline для KYC-проверок и AML по 115-ФЗ: верификация клиентов, мониторинг подозрительных операций, отчётность Росфинмониторингу. Стек — Spark + Greenplum + интеграция с DaData, FincertID, Росфинмониторинг. Подойдёт DE с compliance-фоном.
Регуляторная отчётность ЦБ. Команда занимается отчётами ЦБ: формы 0409, ФЗ-161, IFRS-9 staging. Стек — Greenplum + Airflow + dbt + кастомные правила валидации. Подойдёт DE с банковским DWH-опытом.
B2B-эквайринг и biling. Команда занимается биллингом B2B-клиентов эквайринга. Стек — Greenplum + Airflow + dbt + интеграция с финансовой системой. Подойдёт DE с financial-DWH опытом.
Что QIWI ценит в DE
Production-опыт. История про pipeline в проде с финансовыми последствиями. «Запустил payment-DWH на 5М транзакций в день с T+1 SLA и 99.99% доступностью» — это история.
Понимание fintech-специфики. Что такое idempotency финансовых операций, reconciliation, журнал транзакций (event sourcing) — базовый словарь.
Compliance-зрелость. Кандидат, который понимает 115-ФЗ, ФЗ-161, IFRS-9 — сильный сигнал.
Weak vs strong на архитектурном кейсе. Слабый ответ: «возьмём Kafka + ML-модель для антифрода». Сильный ответ: «real-time антифрод на 10K TPS: события транзакций в Kafka → enrichment-сервис (lookup профиля клиента, истории транзакций из Redis с TTL 1 час, feature-store) → ML-inference (gRPC к модели с timeout 200мс) → decision-engine с правилами и ML-score → ответ approve/decline. Fallback на rule-based при таймауте ML. Audit trail для compliance: каждое решение фиксируется в WORM с подписью, потому что регуляторные споры через 7 лет — норма. Reconciliation между Kafka-events и core-биллингом еженедельно с алертами на расхождение более 0.001%».
Готовность к корпоративной среде и СБ. QIWI — fintech с регуляторкой.
Self-management. Циклы проектов длинные, особенно для compliance.
Как готовиться: план
За 5-7 недель до планируемого собеса:
- Неделя 1-2 — SQL deep dive и data modeling. Оконные функции, рекурсивные CTE, оптимизация транзакционных таблиц, partitioning по времени. Модели данных (event-схемы для платежей, journal-таблицы, SCD типы). Прорешай 30 SQL Medium-Hard задач. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день, чтобы за месяц закрыть пробелы.
- Неделя 3 — Real-time stack и CDC. Kafka, Debezium, Redis для feature lookup, Schema Registry. Прочитай про event sourcing.
- Неделя 4 — Fintech и compliance контекст. Прочитай ЦБ-инструкции 115-ФЗ, ФЗ-161, обзоры по AML, статьи Tinkoff и Сбер про antifraud. Запомни понятия: idempotency финансовых операций, reconciliation, AML, KYC, ATM-flow, эквайринг.
- Неделя 5 — Архитектурные кейсы. Прорешай 5-6 кейсов: real-time антифрод на 10K TPS, payment-DWH с reconciliation, KYC pipeline с интеграциями, регуляторная отчётность ЦБ, B2B-эквайринг billing. Структура — требования → источники → транспорт → процессинг → витрина → SLA → recovery. Kafka streaming.
- Неделя 6-7 — Mocks и behavioral + СБ-документы. Mock-интервью, 5-7 STAR-историй: конфликт с риск-командой, факап в проде, длинный compliance-проект.
Частые ошибки
Игнорируют точность платежей. Кандидат проектирует pipeline без reconciliation с core-биллингом. В fintech расхождение в копейку — это претензия.
Хайпуют streaming везде. Кандидат проектирует регуляторную отчётность через Kafka Streaming. Не упоминает, что для отчёта ЦБ важна не скорость, а консистентность.
Не разбираются в fintech-терминологии. «Что такое idempotency, AML, KYC?» — кандидат теряется.
Игнорируют audit trail. В fintech любое решение должно быть аудируемо. Без audit trail — балл проседает.
Не задают вопросы про SLA и compliance. На кейсе сразу — стек, а не «какие SLA, какие требования регулятора, какой retention». Это первый фильтр.
Связанные темы
- Собеседование на Data Engineer
- Kafka streaming
- CDC и event sourcing
- Собеседование на Data Engineer в Тинькоффе
- Собеседование на Data Scientist в QIWI
FAQ
Удалёнка в QIWI для DE?
Гибрид с офисом в Москве. Полная удалёнка возможна для отдельных позиций (особенно senior+).
Зарплатные вилки 2026?
Middle DE: 270-410k. Senior: 410-650k. Lead — выше, особенно в antifraud и compliance-направлениях.
Нужен ли английский?
Базовый — для документации. Свободного говорящего обычно не требуется.
Сколько этапов?
5-6 этапов, 4-6 недель из-за compliance-проверок и СБ.
Реально ли пройти без fintech-опыта?
Сложно для compliance и core-payment команд. Для B2B-эквайринга или продуктовых витрин — доступнее для DE из любой индустрии.
Какие книги и ресурсы помогут подготовиться?
«Designing Data-Intensive Applications» Мартина Клеппманна, статьи Tinkoff про antifraud, обзоры по payment-системам (Stripe Engineering, Adyen). По SQL — задачник Карьерника.
Что подчеркнуть на финале в QIWI?
Опыт работы с financial-DWH и antifraud, понимание fintech-compliance, готовность к СБ. Истории про оптимизацию real-time-pipeline или работу с большими transaction-volume — сильный плюс.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.