Собеседование на Data Engineer в Альфа-Банке
Содержание:
Почему Альфа — особенный работодатель для DE
Альфа-Банк — один из крупнейших частных банков РФ. Стек: Hadoop / Greenplum / Spark / Airflow / ClickHouse / Kafka. Объёмы — миллиарды транзакций в день, плюс CDC-репликация из transactional систем.
DE в Альфа работает с financial data: транзакции, скоринг, антифрод, AML, регуляторная отчётность. Compliance критичен: 152-ФЗ, ЦБ-репортинг, аудиторские отчёты. Senior DE проектирует pipelines с учётом этих требований.
Актуальные вакансии — на career.alfabank.ru.
Информация основана на публичных источниках и опыте кандидатов. Команды Альфа используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
1. HR-скрининг (30-45 минут)
Знакомство:
- Стек: Hadoop / Greenplum / Spark / Airflow
- Опыт с financial data, compliance
- Motivation: банковская специфика
Питч 90 секунд: продукт, объёмы, регуляторика, impact.
2. SQL deep (60-90 минут)
DE в Альфа пишет много SQL для регуляторной отчётности.
Темы:
- Window functions, CTE, рекурсия
- Greenplum-specific (MPP, distribution, partitioning)
- Оптимизация на больших объёмах
- Дедупликация, late-arriving data
Подготовка: SQL для DE.
3. Spark + Python (60-90 минут)
PySpark для batch processing.
- DataFrame API
- Joins, shuffles, broadcast
- Tuning для больших таблиц
- UDF
Подготовка: Spark deep dive.
4. System design (60-90 минут)
Кейсы:
- Pipeline для AML мониторинга
- CDC-репликация из core banking
- Антифрод real-time
- DWH для регуляторной отчётности
Подготовка: data modeling, CDC и event sourcing, Kafka streaming.
5. Поведенческое + командное (45-60 минут)
Альфа ценит надёжность, attention to detail, ownership. STAR-истории: инциденты, compliance, missed deadlines.
Особенности по командам
Розница (Retail): скоринг кредитных карт, обработка ежедневных транзакций.
Корпоратив: B2B-клиенты, специальные продукты. Меньше объёмы, выше сложность.
Антифрод: real-time pipelines, Kafka heavy. Spark Streaming или Flink.
Регуляторика / Risk: ЦБ-отчётность, аудит, AML. Pedantic data quality.
ML / AI: скоринг, recommendation, NLP для саппорта. Feature engineering.
Что Альфа ценит в DE
- SQL мастерство. Регуляторика требует SQL. Без него — никак.
- Greenplum или ClickHouse. Один из MPP — must.
- Compliance mindset. 152-ФЗ, PII, аудит — без понимания слабая позиция.
- Reliability. Финансовые pipelines требуют 99.9%+ uptime.
- Documentation. Audit trail обязателен. ADR, runbooks.
Как готовиться: план
За 4-6 недель:
- Неделя 1-2 — SQL + Greenplum. Window functions, MPP-оптимизация, partitioning. SQL для DE.
- Неделя 3 — Spark. PySpark, shuffle, joins. Spark deep dive.
- Неделя 4 — System design. CDC, real-time. CDC, Kafka.
- Неделя 5 — Compliance. 152-ФЗ, PII, аудит. безопасность и compliance.
- Неделя 6 — Mocks + behavioral.
Частые ошибки
- Игнор compliance. Спросят про PII и аудит — без знания провал.
- Greenplum «не нужен». В Альфа MPP — must.
- Spark без понимания shuffle / partitioning.
- Без CDC / Kafka. Антифрод и real-time pipelines требуют.
- Без monitoring / SLO опыта. Reliability — приоритет.
Связанные темы
- Собеседование на Data Engineer
- SQL для DE
- Spark deep dive
- CDC и event sourcing
- Kafka streaming
- Мониторинг и data quality
FAQ
Удалёнка в Альфа для DE?
Гибрид часто. Полная удалёнка — реже.
Зарплатные вилки 2026?
Middle DE: 240-380k. Senior: 380-560k. Compliance-tracks выше из-за специфики.
Английский нужен?
Не обязателен.
Сколько этапов?
4-5 этапов, 2-3 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.