Собеседование на Data Engineer в МКБ
Содержание:
Почему МКБ — особенный работодатель для DE
МКБ (Московский Кредитный Банк) — один из крупнейших российских частных банков по активам с сильным фокусом на корпоративном сегменте, при этом активно развивает розницу, инвестиционные продукты, ВЭД-операции и казначейство. Для Data Engineer это специфический контекст: меньше «продуктовой» аналитики, чем в Тинькоффе, и больше корпоративных и казначейских витрин, регуляторной отчётности и интеграций со сложными системами клиентов-корпораций. Стек активно модернизируется, но банк не гонится за хайпом — практичность важнее моды.
Главные DE-домены: построение и поддержка регуляторных витрин (отчётность ЦБ — формы 0409, 101, 102, AML/КОД, обязательные нормативы); корпоративные витрины (анализ клиентского портфеля, концентрация рисков, выручка по продуктам); казначейские pipeline (ALM, ликвидность, IRRBB); CDC с десятков источников разной зрелости (core banking, карточный процессинг, ABS клиентов-корпоратов); single customer view; data quality и lineage для регуляторных проверок; миграция legacy ETL на современный стек dbt+Airflow.
Стек: Oracle (core banking) + PostgreSQL + Greenplum для DWH + ClickHouse для аналитики; Airflow + dbt + Spark; Kafka + Debezium для CDC; data lake на S3-совместимых хранилищах; Grafana и кастомные инструменты для observability. Часть legacy на Informatica и SAS, мигрируется с осторожностью. Команда DE компактная, плотная коммуникация с риск- и казначейской функциями.
Актуальные вакансии — на hh.ru и сайте МКБ.
Информация основана на публичных источниках и опыте кандидатов. Команды МКБ используют разные процессы — формат и этапы зависят от направления и грейда, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 4-6 недель, 4-5 этапов. Процесс корпоративный, но без избыточной бюрократии: HR, техническое интервью, кодинг и SQL, продуктово-архитектурный кейс, финал. Для ролей с допусками к казначейским или регуляторным данным — СБ-этап.
1. HR-скрининг (30-45 минут)
Рекрутер уточняет: production-опыт DE (от 2 лет, желательно с банковским контекстом), знание классического DWH и современного data stack, мотивацию идти именно в МКБ, ожидания по компенсации и формату работы (Москва, гибрид). Готовь питч на 90 секунд про самый зрелый production-pipeline с цифрами по объёмам и SLA.
2. Техническое интервью / SQL и архитектура (60-90 минут)
Базовая секция с senior DE из команды. Темы: SQL deep dive (оконные функции, рекурсивные CTE, оптимизация запросов, partitioning, индексы, EXPLAIN, hints в Oracle), модели данных (звезда, снежинка, SCD типы, Data Vault — характерен для банковских хранилищ), batch vs streaming, CDC (Debezium, log-based vs trigger-based), data quality (тесты в dbt, Great Expectations), data lineage. Часто специфический вопрос: «как ты бы построил инкрементную загрузку для таблицы остатков по корпоративным счетам с пересчётом исторических периодов при коррекции бухгалтерии».
Подготовка: SQL для DE, Data modeling, dbt и моделирование.
3. Python + SQL live coding (60-90 минут)
Задачи прагматичные, без LeetCode Hard: 1-2 на SQL (оконки, JOIN, оптимизация на банковских данных), 1-2 на Python (pandas, простые ETL-задачи). Часто живой кейс: «дам тебе схему таблиц транзакций и сделок казначейства, спроектируй запрос для расчёта позиции по валютам с разбивкой по дням». Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.
Подготовка: SQL для DE.
4. Продуктово-архитектурный кейс (60-90 минут)
Самая характерная секция. Кейс архитектурный: «спроектируй pipeline для расчёта норматива ликвидности Н26», «как ты бы построил витрину для анализа концентрации рисков по корпоративному портфелю», «как сделать CDC с двух систем-источников остатков по разным контурам учёта». Нужно: уточнить требования (объём, SLA, регуляторика), описать архитектуру, выбрать стек и обосновать, продумать data quality и monitoring, обсудить trade-off, заложить план рекавери. Сильный сигнал — учёт регуляторных требований и доказательная цепочка для проверок ЦБ.
Подготовка: Airflow patterns, Monitoring и data quality.
5. Финал с тимлидом / СБ + оффер (1-2 недели)
Беседа с тимлидом и/или руководителем направления. Проверяют поведенческие истории (STAR), отношение к корпоративной работе, готовность к ответственности за регуляторные пайплайны, обсуждают грейд. Для ролей с допусками — СБ-проверка.
Особенности по командам
Регуляторная отчётность и риск-витрины. Команда отвечает за регулярные отчёты ЦБ, обязательные нормативы (Н1, Н2, Н3, Н4, Н26), IFRS-9 staging для риск-функции, AML и КОД-витрины. Стек — Greenplum + Airflow + dbt + Oracle (источник) + кастомные правила валидации. Челлендж — изменения регуляторных требований несколько раз в год, длинные циклы тестирования, необходимость доказательной цепочки и audit trail. Подойдёт кандидатам с банковским DWH-опытом или зрелым ETL-фоном.
Корпоративные витрины и клиентская аналитика. Команда строит витрины для анализа корпоративных клиентов (концентрация рисков, выручка по продуктам, ARPU/cross-sell), single customer view, прогноз продуктового спроса. Стек — dbt + Greenplum + ClickHouse + Airflow + интеграция с CRM и ABS-системами. Челлендж — сложная иерархия клиентов (группа компаний, дочки, связанные лица), особенности корпоративного учёта. Подойдёт DE с background в корпоративном банке или B2B-аналитике.
Казначейство и ALM. Команда строит витрины для казначейства и ALM (Asset-Liability Management): расчёт ликвидности, IRRBB, валютной позиции, прогноз cash flow. Стек — dbt + Greenplum + Oracle + кастомные расчётные движки + Python для финансовых моделей. Челлендж — высокая частота расчётов, реактивность к рыночным шокам, корректность для риск-комитетов. Подойдёт DE с финансовым бэкграундом или казначейским контекстом.
CDC и data integration. Команда занимается интеграцией всех источников банка: core banking, карточный процессинг, ABS клиентов, маркетинг, CRM, внешние data feeds. Стек — Kafka + Debezium + Spark + современный data lake на Iceberg/Hudi. Челлендж — гетерогенные источники, разные графики обновления, ошибки в источниках, регуляторные требования к immutability. Подойдёт DE с big-data и стриминг-background.
Migration team (legacy → modern). Команда занимается миграцией legacy Informatica/SAS-пайплайнов на dbt+Airflow+Spark. Стек — dbt + Airflow + Python + legacy-системы как источники. Челлендж — параллельный запуск с проверкой эквивалентности результатов. Подойдёт кандидатам с зрелым ETL-background и терпением к legacy.
Что МКБ ценит в DE
Production-опыт. История про pipeline в проде с SLA и регуляторной отчётностью. «Сделал pipeline на Kaggle» — не история. «Запустил CDC из 3 source-систем core banking, latency < 60 секунд, 99.95% доступность за 12 месяцев» — это история.
Банковский и корпоративный контекст. Опыт в банке, аудите, страховой или казначействе — большой плюс. Кандидаты из чистого e-com рассматриваются, но с пониманием, что им нужно доучивать корпоративный учёт и регуляторику.
Регуляторная зрелость. Кандидат, который понимает специфику ЦБ-отчётности, IFRS-9, AML — сильный сигнал. Если не работал в банке — освежи термины до собеса.
Weak vs strong на архитектурном кейсе. Слабый ответ: «возьмём Kafka Streaming и Spark для расчёта норматива Н26». Сильный ответ: «норматив ликвидности — это batch с подтверждением консистентности и доказательной цепочкой. Возьму Airflow + dbt + Greenplum. Источники остатков через CDC в data lake, оттуда инкрементная загрузка в DWH через dbt с обязательными reconciliation-тестами на соответствие банковскому учёту. Streaming — для оперативного дашборда казначейства, где нужна свежесть в течение дня, но регуляторный расчёт всегда отдельный batch с подтверждением».
Готовность к корпоративной среде. МКБ — крупный банк с регламентами, согласованиями, СБ-проверками. Кандидат, который ругает «бюрократию» в принципе, рискует получить -1.
Self-management. Циклы проектов длинные. DE, который теряется без ежедневной обратной связи, рассматривается слабее.
Как готовиться: план
За 5-7 недель до планируемого собеса:
- Неделя 1-2 — SQL deep dive и data modeling. Оконные функции, рекурсивные CTE, оптимизация запросов, partitioning, индексы, EXPLAIN, hints в Oracle (если будешь работать с core banking). Модели данных (звезда, снежинка, SCD типы, Data Vault). Прорешай 30 SQL Medium-Hard задач. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день, чтобы за месяц закрыть пробелы по оконкам, JOIN, агрегатам.
- Неделя 3 — Современный data stack. Airflow patterns (sensors, dynamic DAGs, backfill, XCom, deferrable operators), dbt (модели, тесты, snapshots, sources, exposures), Spark (оптимизация, partitioning, shuffle), Kafka и Debezium для CDC.
- Неделя 4 — Банковский и казначейский контекст. Прочитай ЦБ-инструкции 199-И и 138-И, IFRS-9. Запомни понятия: core banking, корреспондентский счёт, корпоративный клиент, дочка/связанные лица, ALM, ликвидность Н26, IRRBB, валютная позиция, обязательные нормативы.
- Неделя 5 — Архитектурные кейсы. Прорешай 5-6 кейсов: норматив ликвидности, концентрация рисков корпоративный портфель, CDC после M&A, single customer view, миграция Informatica → dbt. Структура — требования → источники → транспорт → процессинг → витрина → SLA → recovery. Airflow patterns.
- Неделя 6-7 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: конфликт с риск-командой или казначейством, факап в проде, длинная миграция, история про SLA.
Частые ошибки
Хайпуют стримингом везде. Кандидат проектирует регуляторный расчёт через Kafka Streaming. Не упоминает, что для отчёта ЦБ важна не скорость, а консистентность и доказательная цепочка.
Не разбираются в корпоративной банковской терминологии. «Что такое связанные лица или ESF в АБС?» — кандидат теряется. На архитектурном кейсе это сразу видно.
Не думают про reconciliation. Кандидат строит pipeline без проверки соответствия источникам. В банке расхождение — это потерянная неделя на разбор. Reconciliation должен быть в дизайне с самого начала.
Игнорируют SLA и доступность. Кандидат рассказывает только про функциональность. Не упоминает RPO/RTO, SLA, plan B при недоступности источника.
Не задают вопросы про объёмы и латентность. На кейсе сразу — стек, а не «сколько данных, какие пики, какие SLA, какие требования регуляторики». Это первый фильтр.
Связанные темы
- Собеседование на Data Engineer
- SQL для DE
- dbt и моделирование
- Собеседование на Data Engineer в Альфа-Банке
- Собеседование на Data Engineer в Совкомбанке
FAQ
Удалёнка в МКБ для DE?
Гибрид с офисом в Москве. Полная удалёнка возможна для senior+ при согласовании, но не правило. Для ролей с допусками — чаще офис.
Зарплатные вилки 2026?
Middle DE: 240-370k. Senior: 370-580k. Lead/Staff — выше. Бонусная схема привязана к KPI команды и банка.
Нужен ли английский?
Базовый — для документации. Свободного говорящего не требуется, основная команда русскоязычная. Для работы с международной отчётностью (IFRS) — желательнее.
Сколько этапов?
4-5 этапов, 4-6 недель от первого скрининга до оффера. Для ролей с регуляторными допусками — плюс 1-2 недели на СБ.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.