Собеседование на Data Scientist в СИБУР: этапы, нефтехимия, частые ошибки
В этой статье: Почему СИБУР · Этапы собеседования · Особенности по командам · Что СИБУР ценит · Как готовиться: план · Частые ошибки · Связанные темы · FAQ
СИБУР — крупнейшая в России нефтехимическая компания с активами по переработке углеводородного сырья, производству полимеров (полипропилен, полиэтилен, ПВХ), эластомеров и нефтехимических продуктов. У компании одна из самых зрелых программ цифровизации в индустрии. Data Scientist в СИБУР — это специалист, который работает с непрерывными процессами химической технологии: ректификационные колонны, реакторы полимеризации, компрессоры, теплообменники. Эта статья собрана из публичных описаний вакансий, отзывов кандидатов и общих практик найма в промышленных компаниях — её цель помочь подготовиться, а не пересказать внутренние документы.
Почему СИБУР — особенный работодатель {#pochemu-sibur-osobennyy-rabotodatel}
СИБУР заметно выделяется в индустриальном секторе России зрелостью цифрового стека. Компания активно публикует кейсы, участвует в индустриальных конференциях (DataFest, AI Journey), развивает внутреннюю Data-платформу, MLOps-практики, центры компетенций. Для DS это означает понятную траекторию роста: от прикладных задач на конкретной производственной площадке до архитектуры платформы или работы с цифровыми двойниками крупных установок.
Нефтехимическое производство — это непрерывные процессы с очень большим количеством датчиков и сложной физико-химической интерпретацией. Реактор полимеризации управляется одновременно десятками параметров, а качество продукта зависит от их тонкой комбинации. Это даёт DS интересные задачи: моделирование процессов, soft sensors (виртуальные датчики), advanced process control, predictive maintenance, оптимизация выхода продукта и расхода сырья.
Этапы собеседования {#etapy-sobesedovaniya}
Цикл найма DS в СИБУР обычно занимает 3–5 недель и проходит в 4 этапа.
1. HR-скрининг (25–40 минут)
Рекрутер уточняет опыт, домены (временные ряды, CV, табличные задачи), знание стека, готовность к гибридному формату работы, ожидания. Часто спрашивают про мотивацию: «почему именно нефтехимия».
2. Техническое интервью (60–90 минут)
Основной фильтр. Один-два интервьюера: ведущий DS или ML-инженер. Разбирают конкретные задачи: статистика, классические ML-алгоритмы, особенности работы с временными рядами, методы обнаружения аномалий. Часто просят на месте обсудить кейс: «вот описание реактора, как ты построишь soft-sensor для качества продукта?». Параллельно проверяют SQL и базовый Python.
3. Кейс-интервью / лайв-кодинг (60–90 минут)
В форме реальной задачи: дают синтетические или анонимизированные данные, просят за час построить базовое решение и обосновать выбор подхода. Иногда — обсуждение реального проекта из портфолио кандидата с детальными вопросами по архитектуре решения, метрикам, ошибкам валидации.
4. Финал с руководителем (60 минут)
Здесь акцент на зрелости, опыте, мотивации. Кандидата спрашивают о приоритетах, работе с технологами и production-командами, готовности учиться нефтехимической специфике. Часто разговор уходит в обсуждение конкретных проектов из вашего портфолио.
Особенности по командам {#osobennosti-po-komandam}
Производство полимеров
Челенджи: оптимизация работы реакторов полимеризации, прогноз качества полимера (молекулярно-массовое распределение, ИТР), soft sensors для трудноизмеримых параметров. Технологии: временные ряды, классический ML, методы оптимизации, иногда reinforcement learning. Кому подойдёт: DS с интересом к химико-технологическим процессам.
Газопереработка и углеводороды
Челенджи: оптимизация работы установок газопереработки, ректификации, компрессоров, теплообменников. Технологии: временные ряды, advanced process control, классический ML, методы оптимизации. Кому подойдёт: DS с интересом к непрерывным процессам и тесной работе с технологами.
Predictive maintenance и аномалии
Челенджи: прогноз отказов оборудования (компрессоры, насосы, теплообменники), обнаружение аномалий в работе установок. Технологии: временные ряды, методы аномалий (Isolation Forest, autoencoders), классический ML. Кому подойдёт: DS с интересом к инженерной аналитике и работе с большим объёмом сенсорных данных.
Computer Vision и автоматизация
Челенджи: CV для контроля качества продукции, безопасности, мониторинга оборудования. Технологии: глубокое обучение (CNN, ViT), фреймворки PyTorch/TensorFlow. Кому подойдёт: DS с опытом в CV и готовностью работать с промышленными датасетами.
Что СИБУР ценит в Data Scientist {#chto-sibur-tsenit}
В СИБУР ценят DS, который понимает специфику непрерывных процессов: их особенность в том, что любая модель управляет «текучкой», и плохой прогноз сразу виден на качестве продукта или расходе сырья. Поэтому от DS ждут аккуратной работы с данными, тщательной валидации и понимания физико-химической природы задачи.
Сильный кандидат на интервью говорит про задачу через бизнес-результат: «модель снижает расход сырья на X%, что в масштабах установки даёт Y миллионов рублей в год; погрешность измерений ограничивает потолок улучшения значением Z». Он понимает, что в нефтехимии важна не только метрика на тесте, но и стабильность модели в условиях изменения сырья, износа оборудования, сезонных колебаний.
Простой пример. Постановка «построить soft-sensor для индекса текучести расплава» — слабый DS отвечает: «обучу регрессию на исторических данных лабораторных анализов». Сильный — уточняет: «как часто берутся лабораторные пробы (раз в час, раз в смену)? какие параметры процесса доступны в реальном времени? есть ли задержка между процессом и лабораторным анализом? какая погрешность лабораторного измерения? как будет валидироваться soft-sensor — по сравнению с лабораторией или с независимым измерением?». Только после этого он строит модель.
Как готовиться: план {#kak-gotovitsya-plan}
Подготовка строится в три фазы. Первая — общая база: Python (NumPy, Pandas, scikit-learn), SQL уверенного уровня, математическая статистика (доверительные интервалы, гипотезы, базовая вероятность), классические ML-алгоритмы (линейные модели, деревья, бустинги, базовые нейросети), методы оценки моделей.
Вторая фаза — индустриальная специфика. Изучите особенности временных рядов в промышленности, методы predictive maintenance, soft sensors, advanced process control. Если вы понимаете базовые принципы химической технологии и термодинамики — это плюс, но не обязательно. Полезно посмотреть кейсы СИБУР на конференциях DataFest, AI Journey, Smart Industry — компания активно делится опытом. Поддерживайте форму на тренажёре Карьерник — короткие сессии по SQL, ML и статистике удобно вписываются в рабочий ритм.
Третья фаза — личные кейсы. Подготовьте 2–3 истории из карьеры в формате STAR. Если индустриального опыта нет, сделайте pet-проект с временными рядами или сенсорными данными (Kaggle: process control, manufacturing, energy). Подготовьте отдельную историю про работу с конфликтом метрики и бизнес-результата — в СИБУР это любимая тема.
Частые ошибки {#chastye-oshibki}
- Кандидат говорит про модели абстрактно, без привязки к данным и физическому смыслу.
- Игнорирование специфики процесса. DS, не понимающий, что такое soft sensor или почему в нефтехимии важна стабильность модели, выглядит слабо.
- Слабая работа с временными рядами: data leakage, неправильный split, отсутствие учёта сезонности и режимных переходов.
- Незнание базовой статистики.
- Слабый SQL и нежелание думать о данных.
- Слишком общий рассказ о проектах: «обучил модель, получил метрику». Без описания данных, валидации, причин выбора подхода — этого мало.
Связанные темы {#svyazannye-temy}
- Собеседование на DS в ЛУКОЙЛ
- Собеседование на DS в Газпром
- Собеседование на DS в Газпром нефть
- Собеседование на DS в Северсталь
- Собеседование на DS в Норникель
FAQ {#faq}
Сколько готовиться?
Для среднего грейда DS — 5–8 недель при наличии 1–2 лет опыта. Если опыт смежный — 3–5 месяцев на освоение Python, SQL, ML и базовой статистики.
Нужен ли опыт в нефтехимии?
Желателен, но не обязателен. СИБУР готов взять сильного DS из IT, банков, академии и научить специфике на рабочем месте. Если у вас есть pet-проекты с временными рядами или интерес к промышленной аналитике — это плюс.
Какой стек у СИБУРа?
Python (Pandas, NumPy, scikit-learn, бустинги), временные ряды (statsmodels, Prophet, LSTM/Transformer), PyTorch/TensorFlow для CV, MLflow для трекинга. SQL — Oracle, Postgres, иногда специализированные промышленные хранилища.
Что особенного в нефтехимических задачах?
Непрерывные процессы, длинные временные ряды, физико-химическая интерпретация моделей. В отличие от банковской аналитики, модель здесь часто работает в режиме советника технологу или составной частью advanced process control. Это значит, что любая модель должна объяснять свои прогнозы и быть устойчивой к режимным изменениям.
Какие книги и ресурсы помогают?
Hastie, Tibshirani, Friedman «The Elements of Statistical Learning», курсы по временным рядам, материалы DataFest и AI Journey, кейсы СИБУР на Хабре. Для глубокого погружения — литература по advanced process control и soft sensors.
Возможна ли удалёнка?
Зависит от направления. Часть позиций — гибрид (Москва), часть — выезд на заводы (Тобольск, Нижневартовск и другие площадки). Уточняйте у рекрутера.
Реально ли работать с цифровыми двойниками установок?
Реально. СИБУР — одна из немногих российских компаний, которая активно развивает цифровые двойники крупных установок. Это интересная задача на стыке физико-химического моделирования и ML: классические балансовые модели дополняются ML-компонентами, которые «дообучают» физику на реальных данных. Если вам интересна такая интеграция — этот опыт здесь реально получить, а на рынке за рубежом он востребован в Big Pharma, нефтехимии и металлургии.
Статья основана на публичных источниках: вакансиях, отзывах кандидатов на open-площадках, профильных сообществах и общих практиках найма в нефтехимических компаниях. Конкретные процессы и требования могут отличаться от описанных и меняются со временем — уточняйте детали у рекрутера.