Собеседование на Data Engineer в Газпром Нефти
Содержание:
Почему Газпром Нефть — особенный работодатель для DE
Газпром Нефть — одна из крупнейших энергетических компаний РФ. Активно цифровизируется: ЦИТ ГПН (Центр цифровых трансформаций), digital twins, IoT с буровых, аналитика нефтепереработки, retail-аналитика АЗС. Стек: Hadoop + Greenplum + Spark + Airflow + ClickHouse + PostgreSQL.
DE в Газпром Нефти работает с большими объёмами IoT-данных (миллиарды событий с датчиков), геолого-аналитикой, retail-данными АЗС. Domain — нефтегаз / промышленность / retail. Compliance строгий.
Актуальные вакансии — на career.gazprom-neft.ru.
Информация основана на публичных источниках и опыте кандидатов. Команды Газпром Нефти используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
1. HR-скрининг (30-45 минут)
Знакомство:
- Стек: Hadoop / Greenplum / Spark / Airflow
- Опыт с large-scale данными
- Motivation: промышленность / нефтегаз
Питч 90 секунд: продукт, объёмы, инструменты.
2. SQL deep (60-90 минут)
DE в ГПН пишет много SQL для аналитики и регуляторной отчётности.
Темы:
- Window functions, CTE
- Greenplum-specific (MPP)
- ETL-паттерны
- Оптимизация больших таблиц
Подготовка: SQL для DE.
3. Python + Spark (60-90 минут)
PySpark для batch и IoT streaming.
- DataFrame API
- Partitioning, shuffles
- Time-series IoT data
Подготовка: Spark deep dive.
4. System design (60-90 минут)
Кейсы:
- IoT pipeline с датчиков скважин
- DWH для retail АЗС
- ML pipeline для прогнозирования цен
- Geological data lake
Подготовка: data modeling, Kafka streaming.
5. Поведенческое (45-60 минут)
ГПН ценит надёжность и compliance. STAR: инциденты, missed deadlines, regulatory situations.
Особенности по командам
Upstream (Добыча): IoT данные с буровых, geological data.
Downstream (Переработка): аналитика заводов.
Retail / АЗС: sales, лояльность, programmes.
Risk / Compliance: регуляторная отчётность.
ML / AI: scoring, forecasting цен, predictive maintenance.
Что Газпром Нефть ценит в DE
- SQL + Greenplum. Один из MPP — must.
- Spark уверенно.
- Compliance mindset. Regulatory отчётность.
- Reliability. Critical infrastructure.
- Pragmatism. Решения должны работать в проде.
Как готовиться: план
За 4-6 недель:
- Неделя 1-2 — SQL + Greenplum. SQL для DE.
- Неделя 3 — Spark. Spark deep dive.
- Неделя 4 — System design. IoT, time-series. Kafka.
- Неделя 5 — Compliance + monitoring. мониторинг, безопасность.
- Неделя 6 — Mocks + behavioral.
Частые ошибки
- Greenplum «не нужен». В ГПН MPP — must.
- Spark без понимания shuffle / partitioning.
- Игнор compliance. Regulatory mindset.
- Без IoT понимания. Если в upstream — спросят.
- Без monitoring. Reliability приоритет.
Связанные темы
- Собеседование на Data Engineer
- SQL для DE
- Spark deep dive
- Kafka streaming
- Мониторинг и data quality
- Безопасность и compliance
FAQ
Удалёнка в Газпром Нефти для DE?
Гибрид часто. Полная — реже.
Зарплатные вилки 2026?
Middle DE: 230-370k. Senior: 370-560k.
Английский нужен?
Не обязателен.
Сколько этапов?
4-5 этапов, 2-3 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.