Собеседование на Data Engineer в Газпромбанке
Содержание:
Почему ГПБ — особенный работодатель для DE
Газпромбанк — один из крупнейших коммерческих банков РФ, ориентирован на корпоративный сегмент (особенно нефтегаз). Активно цифровизируется. Стек: Hadoop + Greenplum + Spark + Airflow + ClickHouse + Kafka. Объёмы — миллиарды транзакций.
DE в ГПБ работает с financial data: скоринг, антифрод, AML, регуляторная отчётность ЦБ. Compliance критичен. Engineering culture развивается.
Актуальные вакансии — на career.gazprombank.ru.
Информация основана на публичных источниках и опыте кандидатов. Команды ГПБ используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
1. HR-скрининг (30-45 минут)
Знакомство:
- Стек: Hadoop / Greenplum / Spark / Airflow
- Опыт с financial data
- Compliance background
Питч 90 секунд: продукт, объёмы, регуляторика.
2. SQL deep (60-90 минут)
Темы:
- Window functions, CTE, рекурсия
- Greenplum-specific (MPP)
- ETL-паттерны
- Оптимизация
Подготовка: SQL для DE.
3. Python + Spark (60-90 минут)
PySpark для batch.
- DataFrame API
- Joins, shuffles, broadcast
- Tuning
Подготовка: Spark deep dive.
4. System design (60-90 минут)
Кейсы:
- AML monitoring pipeline
- CDC из core banking
- Real-time антифрод
- DWH для регуляторной отчётности
Подготовка: data modeling, CDC и event sourcing, Kafka streaming.
5. Поведенческое (45-60 минут)
STAR: инциденты, compliance, missed deadlines.
Особенности по командам
Розница: скоринг кредитов и карт.
Корпоратив: B2B клиенты, особенно нефтегаз.
Антифрод: real-time pipelines.
Risk / Compliance: ЦБ-отчётность.
ML / AI: scoring, recommendation.
Что ГПБ ценит в DE
- SQL мастерство.
- Greenplum. MPP — must.
- Compliance mindset. 152-ФЗ.
- Reliability.
- Documentation. Audit trail.
Как готовиться: план
За 4-6 недель:
- Неделя 1-2 — SQL + Greenplum. SQL для DE.
- Неделя 3 — Spark. Spark deep dive.
- Неделя 4 — System design. CDC, Kafka.
- Неделя 5 — Compliance. безопасность.
- Неделя 6 — Mocks + behavioral.
Частые ошибки
- Игнор compliance.
- Greenplum «не нужен».
- Spark без shuffle.
- Без CDC.
- Без monitoring.
Связанные темы
- Собеседование на Data Engineer
- SQL для DE
- Spark deep dive
- CDC и event sourcing
- Kafka streaming
- Мониторинг и data quality
FAQ
Удалёнка в ГПБ для DE?
Гибрид часто. Полная — реже из-за compliance.
Зарплатные вилки 2026?
Middle DE: 230-370k. Senior: 370-550k.
Английский нужен?
Не обязателен.
Сколько этапов?
4-5 этапов, 2-3 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.