Собеседование на Data Engineer в Открытие
Содержание:
Почему Открытие — особенный работодатель для DE
Банк «Открытие» — крупный универсальный банк, исторически переживший несколько санаций и сейчас входящий в периметр группы ВТБ. Розничный и корпоративный бизнес, инвестиционные продукты, страхование, накопительные счета. Для Data Engineer это очень специфический контекст: с одной стороны — банковская «нормальность» (классический DWH, регуляторика, IFRS-9), с другой — большой интеграционный проект слияния с ВТБ, который продолжается несколько лет и приводит к гибридному стеку и большой нагрузке на DE-команду по миграциям и data reconciliation.
Главные DE-домены: построение и поддержка регуляторных витрин (ЦБ-отчётность, AML/КОД, обязательные нормативы); CDC с десятков источников разной зрелости (core banking Открытия, core banking ВТБ после переноса перенесённых клиентов, карточные процессинги, ABS); миграционные pipeline (перенос данных клиентов и продуктов в системы ВТБ, проверка эквивалентности); корпоративные и розничные витрины; data quality и lineage для регуляторных проверок и аудита группы; казначейские pipeline; migration team.
Стек: Oracle (core banking) + Greenplum + PostgreSQL + ClickHouse для аналитики; Airflow + dbt + Spark; Kafka + Debezium для CDC; data lake; внутренние инструменты группы ВТБ для observability. Часть legacy на Informatica и SAS, активная миграция. Команда DE крупная из-за интеграционных проектов.
Актуальные вакансии — на hh.ru и сайте Открытия / группы ВТБ.
Информация основана на публичных источниках и опыте кандидатов. Команды Открытия используют разные процессы, особенно с учётом интеграции в группу ВТБ — формат, этапы и компенсация зависят от направления и грейда, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 4-6 недель, 4-5 этапов. Процесс корпоративный с учётом интеграции в ВТБ: HR, техническое интервью, кодинг и SQL, продуктово-архитектурный кейс, финал. Для ролей с допусками — СБ-этап.
1. HR-скрининг (30-45 минут)
Рекрутер уточняет: production-опыт DE (от 2 лет, желательно с банковским контекстом или большими миграциями), знание классического DWH и современного data stack, мотивацию идти в Открытие с учётом группы ВТБ, ожидания по компенсации и формату работы (Москва, гибрид). Готовь питч на 90 секунд про самый зрелый production-pipeline или миграционный проект с цифрами.
2. Техническое интервью / SQL и архитектура (60-90 минут)
Базовая секция с senior DE из команды. Темы: SQL deep dive (оконные функции, рекурсивные CTE, оптимизация запросов, partitioning, индексы, EXPLAIN), модели данных (звезда, снежинка, SCD типы, Data Vault — характерен для банковских миграционных проектов), batch vs streaming, CDC (Debezium), data quality (тесты в dbt, Great Expectations), data lineage. Специфический вопрос для интеграционного контекста: «как ты бы построил pipeline для проверки эквивалентности данных в двух core banking при миграции клиентов».
Подготовка: SQL для DE, Data modeling, CDC и event sourcing.
3. Python + SQL live coding (60-90 минут)
Задачи прагматичные, без LeetCode Hard: 1-2 на SQL (оконки, JOIN, оптимизация на банковских данных), 1-2 на Python (pandas, простые ETL, валидация и сверка). Часто живой кейс на миграционных данных: «дам тебе фрейм клиентов из старой и новой системы, найди расхождения и категории ошибок». Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.
Подготовка: SQL для DE.
4. Продуктово-архитектурный кейс (60-90 минут)
Самая характерная секция. Кейс архитектурный: «спроектируй pipeline для миграции клиентов и их продуктов из Открытия в core banking ВТБ с проверкой эквивалентности», «как ты бы построил CDC во время гибридного существования двух АБС», «как сделать sинхронизацию single customer view между системами в переходный период». Нужно: уточнить требования, описать архитектуру (источники → транспорт → процессинг → витрина), выбрать стек и обосновать, продумать data quality и reconciliation, обсудить trade-off, заложить план рекавери. Сильный сигнал — учёт миграционных особенностей: гибридное существование систем, поэтапная миграция, обратимость.
Подготовка: Airflow patterns, Monitoring и data quality.
5. Финал с тимлидом / СБ + оффер (1-2 недели)
Беседа с тимлидом или руководителем направления. Проверяют поведенческие истории (STAR), отношение к корпоративной работе с большой интеграцией, готовность к ответственности за миграционные pipeline. Для ролей с допусками — СБ-проверка.
Особенности по командам
Регуляторная отчётность и риск-витрины. Команда отвечает за регулярные отчёты ЦБ, обязательные нормативы, IFRS-9 staging для риск-функции, AML и КОД-витрины. Стек — Greenplum + Airflow + dbt + Oracle + кастомные правила валидации. Челлендж — изменения регуляторных требований несколько раз в год, длинные циклы тестирования. Подойдёт кандидатам с банковским DWH-опытом или зрелым ETL-фоном.
Migration team (интеграция с ВТБ). Команда занимается миграцией данных клиентов, продуктов, остатков, истории операций в системы ВТБ. Стек — dbt + Airflow + Spark + кастомные сверочные инструменты + Python для валидации. Челленджи — двухсторонняя сверка миллионов записей, обратимость операций, поэтапная миграция, гибридное существование систем. Подойдёт DE с зрелым ETL/DWH-опытом и терпением к интеграционной работе.
CDC и data integration. Команда занимается интеграцией всех источников банка: core banking, карточный процессинг, ABS, специализированные системы группы. Стек — Kafka + Debezium + Spark + data lake. Челлендж — гетерогенные источники, разные графики обновления, регуляторные требования к immutability. Подойдёт DE с big-data и стриминг-background.
Корпоративные витрины и клиентская аналитика. Команда строит витрины для анализа корпоративных клиентов (концентрация рисков, выручка по продуктам), single customer view. Стек — dbt + Greenplum + ClickHouse + Airflow. Челлендж — миграционная неопределённость, сложная иерархия клиентов. Подойдёт DE с background в корпоративном банке.
Казначейство и ALM. Команда строит витрины для казначейства и ALM: расчёт ликвидности, IRRBB, валютной позиции. Стек — dbt + Greenplum + Oracle + кастомные расчётные движки. Подойдёт DE с финансовым бэкграундом или казначейским контекстом.
Что Открытие ценит в DE
Production-опыт. История про pipeline в проде с SLA и регуляторной отчётностью. Сильный сигнал — кейсы с большими миграциями данных или интеграциями систем после M&A.
Банковский контекст. Опыт в банке, страховой или fintech — большой плюс. Опыт миграций или интеграционных проектов после M&A — ещё больший плюс, особенно с учётом текущей фазы интеграции в группу ВТБ.
Терпение к интеграционной работе. Кандидат, который любит «зелёное поле» и стартапы, в Открытии будет страдать. Сильный — тот, кто получает удовольствие от reconciliation двух баз и поэтапной миграции с обратимостью.
Weak vs strong на архитектурном кейсе. Слабый ответ: «возьмём Kafka Streaming для миграции клиентов из Открытия в ВТБ — это modern stack». Сильный ответ: «миграция клиентов требует batch с reconciliation и обратимостью. Возьму Airflow + dbt + Spark. Этап 1 — выгрузка из Открытия в data lake с подписанными снапшотами. Этап 2 — трансформация в формат ВТБ через dbt с обязательными reconciliation-тестами (по чек-суммам, агрегатам, выборочной сверке записей). Этап 3 — загрузка в новую систему с rollback-планом. Стриминг — только для синхронизации операционных событий в переходный период, но миграционные batch-runs всегда отдельные с подтверждением».
Готовность к корпоративной среде. Открытие — крупный банк в группе ВТБ, регламентов много, согласования занимают время. Кандидат, который ругает «бюрократию» в принципе, рискует получить -1.
Self-management. Циклы проектов длинные. DE, который теряется без ежедневной обратной связи, рассматривается слабее.
Как готовиться: план
За 5-7 недель до планируемого собеса:
- Неделя 1-2 — SQL deep dive и data modeling. Оконные функции, рекурсивные CTE, оптимизация запросов, partitioning, индексы, EXPLAIN. Модели данных (звезда, снежинка, SCD типы, Data Vault). Прорешай 30 SQL Medium-Hard задач. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день, чтобы закрыть пробелы по оконкам, JOIN, агрегатам и не путаться в простых вопросах.
- Неделя 3 — Современный data stack и миграционные паттерны. Airflow patterns (sensors, dynamic DAGs, backfill, XCom), dbt (модели, тесты, snapshots, sources), Spark (оптимизация, partitioning), Kafka и Debezium для CDC. Дополнительно — миграционные паттерны (dual-write, change tracking, reconciliation strategies).
- Неделя 4 — Банковский контекст. Прочитай ЦБ-инструкции 199-И и 138-И, IFRS-9. Запомни понятия: core banking, корпоративный клиент, ALM, ликвидность Н26, обязательные нормативы, M&A в банке, переходная балансовая отчётность.
- Неделя 5 — Архитектурные кейсы. Прорешай 5-6 кейсов: миграция клиентов между АБС, регуляторная отчётность в переходный период, single customer view в гибридной среде, CDC после M&A, reconciliation pipeline. Структура — требования → источники → транспорт → процессинг → витрина → reconciliation → SLA → recovery. Airflow patterns.
- Неделя 6-7 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: миграционный проект, факап в проде при миграции, конфликт с командой ВТБ, история про reconciliation и data quality.
Частые ошибки
Хайпуют стримингом везде. Кандидат проектирует миграцию через Kafka Streaming. Не упоминает, что для миграции нужны обратимые batch-операции с reconciliation. Балл проседает.
Не разбираются в банковской терминологии. «Что такое связанные лица или ESF в АБС, переходный баланс?» — кандидат теряется. На архитектурном кейсе это сразу видно.
Не думают про reconciliation и обратимость. Кандидат строит миграционный pipeline без проверки соответствия и без rollback-плана. В банке это критичная ошибка.
Игнорируют гибридную среду. В переходный период работают обе системы. Кандидат, который проектирует «жёсткий переключатель», не понимает реальности.
Не задают вопросы про объёмы и SLA. На кейсе сразу — стек, а не «сколько клиентов мигрируем, какие данные, какие SLA на переключение, какой rollback-window». Это первый фильтр.
Связанные темы
- Собеседование на Data Engineer
- SQL для DE
- CDC и event sourcing
- Собеседование на Data Engineer в ВТБ
- Собеседование на Data Scientist в Открытии
FAQ
Удалёнка в Открытии для DE?
Гибрид с офисом в Москве (БЦ «Лефортово» и другие). Полная удалёнка возможна для senior+ при согласовании, но не правило. Для ролей с допусками к чувствительным данным — чаще офис.
Зарплатные вилки 2026?
Middle DE: 250-380k. Senior: 380-600k. Lead/Staff — выше, особенно в миграционных и intermediate-направлениях. Бонусная схема привязана к KPI команды и группы ВТБ.
Нужен ли английский?
Базовый — для документации. Свободного говорящего не требуется, основная команда русскоязычная.
Сколько этапов?
4-5 этапов, 4-6 недель от первого скрининга до оффера. Для ролей с допусками — плюс 1-2 недели на СБ. Согласования группы ВТБ могут добавить время.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам, особенно с учётом интеграции в группу ВТБ.