Собеседование на Data Engineer в ПСБ
Содержание:
Почему ПСБ — особенный работодатель для DE
ПСБ (Промсвязьбанк) — крупный государственный банк с особым статусом: универсальный банк с фокусом на корпоративном сегменте, дополнительно — опорный банк по обслуживанию гособоронзаказа (ГОЗ) и сделок в оборонно-промышленном комплексе. Для Data Engineer это специфический контекст: классическая банковская регуляторика (ЦБ-отчётность, AML, IFRS-9) дополняется требованиями по ГОЗ (275-ФЗ — отдельная пирамидальная отчётность движения средств по контрактам). Стек активно модернизируется, но особый статус накладывает дополнительную ответственность за data quality и безопасность.
Главные DE-домены: построение и поддержка регуляторных витрин (ЦБ-отчётность, AML/КОД, 115-ФЗ); ГОЗ-pipeline (отчётность по контрактам, движение средств по отдельным счетам, контроль ограничений 275-ФЗ); корпоративные витрины (анализ клиентского портфеля, концентрация рисков, выручка по продуктам); CDC с десятков источников (core banking, карточный процессинг, ABS клиентов-корпоратов, специализированные ГОЗ-системы); казначейские витрины (ликвидность, ALM, IRRBB); data quality и lineage для регуляторных и ГОЗ-проверок; миграция legacy ETL на современный стек.
Стек: Oracle и MS SQL Server (core banking) + PostgreSQL + Greenplum для DWH + ClickHouse для аналитики; Airflow + dbt + Spark; Kafka + Debezium для CDC; data lake на S3-совместимых хранилищах; собственные инструменты для observability и compliance-логирования. Часть legacy на Informatica и SAS. Команда DE средняя по размеру, плотная коммуникация с риск-, казначейской и compliance-функциями.
Актуальные вакансии — на hh.ru и сайте ПСБ.
Информация основана на публичных источниках и опыте кандидатов. Команды ПСБ используют разные процессы — формат и этапы зависят от направления и грейда, для ролей с ГОЗ-доступом обязательна СБ-проверка, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 5-8 недель, 5-6 этапов. Процесс корпоративный с СБ-проверкой: HR, техническое интервью, кодинг и SQL, продуктово-архитектурный кейс, поведенческое, финал. Для ролей с допусками к ГОЗ-данным — расширенная СБ-проверка, которая может занять до 4 недель.
1. HR-скрининг (30-45 минут)
Рекрутер уточняет: production-опыт DE (от 2-3 лет, желательно с банковским контекстом), знание классического DWH и современного data stack, мотивацию идти именно в ПСБ, ожидания по компенсации и формату работы (Москва, гибрид), готовность к СБ-проверке и работе с критичными данными. Готовь питч на 90 секунд про самый зрелый production-pipeline с цифрами по объёмам и SLA.
2. Техническое интервью / SQL и архитектура (60-90 минут)
Базовая секция с senior DE из команды. Темы: SQL deep dive (оконные функции, рекурсивные CTE, оптимизация запросов, partitioning, индексы, EXPLAIN, специфика Oracle и MS SQL), модели данных (звезда, снежинка, SCD типы, Data Vault), batch vs streaming, CDC (Debezium), data quality (тесты в dbt, Great Expectations, кастомные правила для ГОЗ), data lineage и audit trail. Специфический вопрос: «как ты бы построил pipeline для контроля движения средств по контрактам ГОЗ с проверкой соответствия 275-ФЗ».
Подготовка: SQL для DE, Data modeling, CDC и event sourcing.
3. Python + SQL live coding (60 минут)
Задачи прагматичные: 1-2 на SQL (оконки, JOIN, оптимизация на банковских данных), 1-2 на Python (pandas, простые ETL, валидация). Часто живой кейс: «дам тебе схему таблиц транзакций ГОЗ и спецификации контракта, проверь, что движения по счёту соответствуют ограничениям контракта». Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.
Подготовка: SQL для DE.
4. Продуктово-архитектурный кейс (90 минут)
Самая характерная секция. Кейс архитектурный: «спроектируй pipeline для отчётности по 275-ФЗ», «как ты бы построил CDC для корпоративных платежей с особым контуром учёта ГОЗ», «как сделать витрину для риск-функции с учётом immutable-аудита». Нужно: уточнить требования (объём, SLA, регуляторика, compliance), описать архитектуру, выбрать стек и обосновать, продумать data quality, compliance-логи и monitoring, обсудить trade-off batch vs streaming, заложить план рекавери. Сильный сигнал — учёт особого статуса ПСБ и требований 275-ФЗ.
Подготовка: Airflow patterns, Monitoring и data quality.
5. Поведенческое + СБ (45-60 минут + до 4 недель)
Беседа с тимлидом или руководителем направления. STAR-формат: расскажи про конфликт с регулятором или внутренним аудитом, факап в проде, длинный compliance-проект. Параллельно идёт СБ-проверка — для ГОЗ-команд расширенная.
6. Финал с руководителем + оффер
Финальная встреча: грейд, оффер, обсуждение проектов. Корректировки по цифрам.
Особенности по командам
Регуляторная отчётность и ЦБ-витрины. Команда отвечает за регулярные отчёты ЦБ, обязательные нормативы, IFRS-9 staging для риск-функции, AML и КОД-витрины. Стек — Greenplum + Airflow + dbt + Oracle + кастомные правила валидации. Челлендж — изменения регуляторных требований несколько раз в год, длинные циклы тестирования, необходимость доказательной цепочки. Подойдёт кандидатам с банковским DWH-опытом или зрелым ETL-фоном.
ГОЗ-pipeline (275-ФЗ). Команда занимается отчётностью и контролем движения средств по контрактам ГОЗ: отдельные счета по контрактам, проверка целевого использования, отчётность Минфину и заказчикам. Стек — dbt + Greenplum + Oracle + специализированные ГОЗ-системы как источники + кастомные правила. Челлендж — высокая ответственность, требования к immutable audit trail, СБ-доступ. Подойдёт кандидатам с зрелым DWH-опытом и готовностью к compliance-нагрузке.
Корпоративные витрины и клиентская аналитика. Команда строит витрины для анализа корпоративных клиентов (концентрация рисков, выручка по продуктам, ARPU/cross-sell), single customer view. Стек — dbt + Greenplum + ClickHouse + Airflow + интеграция с CRM и ABS-системами. Челлендж — сложная иерархия клиентов, ВЭД-операции, специфика корпоративных продуктов. Подойдёт DE с background в корпоративном банке.
Казначейство и ALM. Команда строит витрины для казначейства и ALM: расчёт ликвидности, IRRBB, валютной позиции, прогноз cash flow. Стек — dbt + Greenplum + Oracle + кастомные расчётные движки. Челлендж — реактивность к рыночным шокам, корректность для риск-комитетов. Подойдёт DE с финансовым бэкграундом.
CDC и data integration. Команда занимается интеграцией всех источников банка: core banking, карточный процессинг, ABS клиентов, специализированные ГОЗ-системы. Стек — Kafka + Debezium + Spark + data lake. Челлендж — гетерогенные источники, разные графики обновления, регуляторные требования к immutability, особый контур для ГОЗ. Подойдёт DE с big-data и стриминг-background.
Что ПСБ ценит в DE
Production-опыт. История про pipeline в проде с SLA и регуляторной отчётностью. «Сделал pipeline на Kaggle» — не история. «Запустил CDC из 4 source-систем core banking, latency < 60 секунд, 99.95% доступность за 12 месяцев» — это история.
Банковский и compliance-контекст. Опыт в банке, аудите, страховой или казначействе — большой плюс. Кандидаты из чистого e-com рассматриваются, но с пониманием, что им нужно доучивать регуляторику. Для ГОЗ-команд знание 275-ФЗ — значительный плюс.
Compliance-зрелость. Кандидат, который понимает специфику audit trail, immutable logs, доказательной цепочки — сильный сигнал. Если на кейсе нет ни слова про compliance — балл просядет.
Weak vs strong на архитектурном кейсе. Слабый ответ: «сделаем стриминг для ГОЗ-отчётности, чтобы было real-time». Сильный ответ: «для ГОЗ-отчётности по 275-ФЗ нужен batch с reconciliation и audit trail. Возьму Airflow + dbt + Greenplum + immutable WORM-хранилище для логов событий и компонент. Источники — через CDC, но в DWH идёт инкрементная загрузка с обязательными reconciliation-тестами и подписанными снапшотами. Стриминг — для оперативного мониторинга, но регуляторная цифра всегда отдельный batch с подтверждением и доказательной цепочкой».
Готовность к корпоративной среде и СБ. ПСБ — банк с особым статусом, регламентов больше, СБ-проверки серьёзные. Кандидат, который ругает «бюрократию» или не готов к СБ-проверке, рассматривается слабее.
Self-management. Циклы проектов длинные, особенно в ГОЗ. DE, который теряется без ежедневной обратной связи, рассматривается слабее.
Как готовиться: план
За 6-8 недель до планируемого собеса:
- Неделя 1-2 — SQL deep dive и data modeling. Оконные функции, рекурсивные CTE, оптимизация запросов, partitioning, индексы, EXPLAIN, специфика Oracle и MS SQL. Модели данных (звезда, снежинка, SCD типы, Data Vault). Прорешай 30 SQL Medium-Hard задач. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день, чтобы за месяц закрыть пробелы по оконкам, JOIN, агрегатам.
- Неделя 3 — Современный data stack. Airflow patterns, dbt (модели, тесты, snapshots, sources), Spark (оптимизация, partitioning, shuffle), Kafka и Debezium для CDC.
- Неделя 4 — Банковский и compliance-контекст. Прочитай ЦБ-инструкции 199-И и 138-И, IFRS-9, обзорно 275-ФЗ если идёшь в ГОЗ-команду. Запомни понятия: core banking, корпоративный клиент, ALM, ликвидность Н26, обязательные нормативы, контракт ГОЗ, отдельный счёт, целевое использование.
- Неделя 5 — Архитектурные кейсы. Прорешай 5-6 кейсов: регуляторная отчётность ЦБ, ГОЗ-отчётность 275-ФЗ, концентрация рисков, CDC с особым контуром, миграция legacy. Структура — требования → источники → транспорт → процессинг → витрина → audit trail → SLA → recovery. Airflow patterns.
- Неделя 6-8 — СБ + behavioral. Если есть СБ-проверка, она занимает время — фоном собирай документы. Mock-интервью, 5-7 STAR-историй: конфликт с регулятором, факап в проде, длинная миграция, история про работу с особыми данными.
Частые ошибки
Не понимают compliance-контекст. Кандидат проектирует «modern stack» через Kafka Streaming для ГОЗ-отчётности. Не упоминает, что для 275-ФЗ важна не скорость, а доказательная цепочка и immutability.
Игнорируют 275-ФЗ для ГОЗ-команд. Кандидат на собес в ГОЗ-команду не знает, что такое контракт ГОЗ, отдельный счёт, целевое использование. Балл проседает мгновенно.
Не думают про reconciliation. Кандидат строит pipeline без проверки соответствия источникам. В банке расхождение — это потерянная неделя на разбор, в ГОЗ — претензии прокуратуры.
Игнорируют audit trail и immutability. В compliance-pipeline нужен immutable log и подписанные снапшоты. Кандидат, который этого не упоминает, теряет балл.
Не готовы к СБ. Кандидат смущается СБ-проверке. Для ПСБ это норма — особый статус банка. Если категорически против — лучше не идти в ГОЗ-команды.
Связанные темы
- Собеседование на Data Engineer
- SQL для DE
- CDC и event sourcing
- Собеседование на Data Engineer в Сбере
- Собеседование на Data Scientist в ПСБ
FAQ
Удалёнка в ПСБ для DE?
Гибрид с офисом в Москве. Полная удалёнка возможна для отдельных позиций, но для ролей с допусками — обязательно офис.
Зарплатные вилки 2026?
Middle DE: 250-380k. Senior: 380-600k. Lead/Staff — выше, особенно в ГОЗ и compliance-направлениях, где надбавка за допуск. Соцпакет банка, годовая премия по KPI.
Нужен ли английский?
Базовый — для документации. Свободного говорящего не требуется, основная команда русскоязычная.
Сколько этапов?
5-6 этапов, 5-8 недель из-за СБ-проверки. Для ГОЗ-ролей — до 8-10 недель из-за расширенного допуска.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам, для ГОЗ-команд требования жёстче.