Собеседование на Data Scientist в Газпром Нефти
Содержание:
Почему ГПН — особенный работодатель для DS
Газпром Нефть — одна из крупнейших энергокомпаний РФ. DS-команды работают над predictive maintenance оборудования (буровые, заводы), forecasting цен на нефть и нефтепродукты, оптимизацией добычи (reservoir modeling), CV для геологии, retail-аналитикой АЗС.
Стек: Python + scikit-learn + LightGBM + PyTorch + Spark + Hadoop + Greenplum + MLflow. Domain специфичен: нефтегаз, инженерные системы, IoT.
Актуальные вакансии — на career.gazprom-neft.ru.
Информация основана на публичных источниках и опыте кандидатов. Команды ГПН используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
1. HR-скрининг (30-45 минут)
Знакомство:
- Опыт ML, особенно в промышленности / IoT
- Стек: sklearn / LightGBM / PyTorch / Spark
- Motivation: нефтегаз
Питч 90 секунд: задача, данные, модель, метрика, impact.
2. ML теория (60-90 минут)
- Классика: bias-variance, регуляризация
- Бустинги
- Time-series forecasting
- Anomaly detection (для predictive maintenance)
Подготовка: ML-теория, time-series.
3. Python + SQL (60-90 минут)
Live coding.
- Pandas / NumPy
- SQL window functions
- Алгоритмы medium
Подготовка: Python для DS.
4. ML System Design (60-90 минут)
Кейсы:
- Predictive maintenance оборудования
- Forecasting цен на нефть
- Anomaly detection в IoT-датчиках
- Retail АЗС: customer segmentation
Подготовка: ML system design, feature engineering.
5. Поведенческое (45-60 минут)
STAR: cross-team с инженерами, regulatory, missed deadlines.
Особенности по командам
Upstream: reservoir modeling, добыча.
Downstream: оптимизация заводов.
Retail / АЗС: customer ML, лояльность.
Risk / ESG: ML для регуляторики.
Innovation Hub: новые направления, CV, NLP.
Что ГПН ценит в DS
- ML фундамент. Бустинги, time-series.
- Domain expertise. Нефтегаз / промышленность — плюс.
- SQL уверенно.
- Production mindset.
- Cross-disciplinary. Работа с инженерами.
Как готовиться: план
За 4-6 недель:
- Неделя 1-2 — ML теория + time-series. ML-теория, time-series.
- Неделя 3 — Python + SQL. Python для DS.
- Неделя 4 — System design. Industrial ML. ML system design.
- Неделя 5 — A/B + production. A/B для DS.
- Неделя 6 — Mocks + behavioral.
Частые ошибки
- Без time-series. Predictive maintenance требует.
- «Только deep learning».
- Слабый SQL.
- Без industrial domain.
- Без production.
Связанные темы
- Собеседование на Data Scientist
- ML-теория на собесе DS
- Time-series на собесе
- ML system design
- Feature engineering
- A/B-тесты для DS
FAQ
Удалёнка в ГПН для DS?
Гибрид часто.
Зарплатные вилки 2026?
Middle DS: 250-380k. Senior: 380-580k.
Английский нужен?
Не обязателен.
Сколько этапов?
4-5 этапов, 2-3 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.