Собеседование на Data Scientist в НЛМК: этапы, индустриальные задачи, ошибки

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

НЛМК — Новолипецкий металлургический комбинат, один из ведущих мировых производителей стальной продукции с активами в России, Европе и США и активной цифровой трансформацией. Data Scientist в НЛМК — это специалист, который работает с потоками сенсорных данных от агрегатов, оптимизирует расход сырья и энергии, помогает технологам подбирать режимы и рецептуры, или строит модели контроля качества проката. Эта статья собрана из публичных описаний вакансий, отзывов кандидатов и общих практик найма в промышленных компаниях — её цель помочь подготовиться, а не пересказать внутренние документы.

Почему НЛМК — особенный работодатель {#pochemu-nlmk-osobennyy-rabotodatel}

НЛМК исторически отличался сильной инженерной школой и заметной программой цифровизации: компания активно публикует кейсы, участвует в индустриальных конференциях, развивает внутреннюю Data-платформу. Для DS это означает интересную смесь: большая промышленность с многолетними традициями и относительно зрелые ML-практики, понимающее руководство, инфраструктура для экспериментов.

Также НЛМК активно работает с международными проектами и партнёрами, что добавляет в задачах оттенок «бизнеса с большой буквы»: ценовые модели для контрактов, прогнозы спроса на разных рынках, оптимизация цепочек поставок. Это делает работу DS разнообразнее — можно одновременно заниматься предиктивкой на печах и моделями ценообразования. Зрелая Data-платформа в свою очередь снижает порог входа: вам не придётся самостоятельно разбираться с сырыми SCADA-файлами, многие интеграции уже сделаны.

Этапы собеседования {#etapy-sobesedovaniya}

Цикл найма DS в НЛМК обычно занимает 3–5 недель и проходит в 4 этапа.

1. HR-скрининг (25–40 минут)

Рекрутер уточняет опыт, домены (временные ряды, CV, табличные задачи), знание стека, готовность к гибридному формату, ожидания. Часто спрашивают про опыт работы с промышленными или научно-инженерными данными — это плюс, но не обязательно. Может всплыть вопрос про знание английского, если позиция связана с международными проектами.

2. Техническое интервью (60–90 минут)

Основной фильтр. Один-два интервьюера: ведущий DS или ML-инженер. Разбирают конкретные задачи: статистика, классические ML-алгоритмы, особенности работы с временными рядами, методы обнаружения аномалий. Часто просят на месте обсудить кейс: «вот описание агрегата, какие данные ты возьмёшь и как построишь модель?». Параллельно проверяют SQL: уверенный уровень с оконными функциями.

3. Кейс-интервью / лайв-кодинг (60–90 минут)

В форме реальной задачи: дают синтетические или анонимизированные данные, просят за час построить базовое решение и обосновать выбор подхода. Может быть алгоритмическая задача средней сложности или практическое задание на feature engineering. Иногда — обсуждение чужого решения: «вот код модели, что не так и как улучшить?».

4. Финал с руководителем (60 минут)

Здесь акцент на зрелости, мотивации, видении карьеры. Кандидата спрашивают о приоритетах, как он работает с технологами и продакшн-командой, как доводит модель от прототипа до промышленной эксплуатации. Часто разговор уходит в обсуждение конкретных проектов из вашего портфолио: что именно вы делали, какие сложности возникали, какие метрики вы показывали.

Особенности по командам {#osobennosti-po-komandam}

Доменное и сталеплавильное производство

Челенджи: оптимизация работы печей и конвертеров, прогноз качества чугуна и стали, контроль расхода кокса, лома, флюсов. Технологии: временные ряды, классический ML, методы оптимизации (Bayesian, surrogate models), иногда reinforcement learning. Кому подойдёт: DS с интересом к долгосрочным задачам и тесной работе с технологами.

Прокатное производство

Челенджи: контроль геометрии и качества проката, прогноз дефектов, оптимизация скоростей и температур, минимизация обрезов. Технологии: Computer Vision (поверхность проката), классический ML, временные ряды. Кому подойдёт: DS с опытом в CV или готовностью его быстро освоить.

Бизнес-аналитика и коммерция

Челенджи: прогноз спроса на разных рынках, ценовые модели B2B, оптимизация портфеля продукции. Технологии: Python, SQL, классические ML-модели, BI-инструменты. Кому подойдёт: DS с интересом к коммерческой аналитике и контактом с продажами/маркетингом.

MLOps и data-платформа

Челенджи: инфраструктура для деплоя моделей, мониторинг качества, переобучение, MLOps-практики. Технологии: Python, Docker/Kubernetes, MLflow или аналоги, CI/CD для ML-моделей. Кому подойдёт: DS/ML-инженеру, которому интересна инфраструктурная часть и масштабирование.

Что НЛМК ценит в Data Scientist {#chto-nlmk-tsenit}

НЛМК ценит DS, который умеет работать на длинной дистанции: не сдаваться после первого «модель не зашла», находить способы донести ценность до бизнеса, строить решения с учётом эксплуатационных ограничений. Сильный кандидат говорит про задачу через метрики бизнеса и эксплуатации: «снижение брака на X%, эффект Y миллионов рублей в год; внедрение требует доработки SCADA и регламента». Слабый — рассказывает только про метрики на холдаут-выборке.

Простой пример. Постановка «оптимизировать расход кокса в доменной печи» — сильный DS уточняет: «какой текущий расход (тонн на тонну чугуна), какие технологические ограничения (температурный режим, химический состав), какие параметры можно менять (расход дутья, температура воздуха, влажность), какие границы безопасности должны соблюдаться? есть ли исторические эксперименты по изменению параметров? как валидировать модель перед промышленным запуском?». Только после этого он начинает работать.

НЛМК также любит DS, который умеет коммуницировать. Это компания с большим количеством стейкхолдеров: технологи, эксплуатация, IT, безопасность, финансы. Умение объяснять модель на языке аудитории — от математически точного до интуитивно простого — здесь ценится. Если кандидат на интервью говорит только формулами или только метафорами, это сразу видно.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план {#kak-gotovitsya-plan}

Подготовка строится в три фазы. Первая — общая база: Python (NumPy, Pandas, scikit-learn), SQL уверенного уровня (JOIN, оконные функции, агрегации), математическая статистика (доверительные интервалы, гипотезы, базовая вероятность), классические ML-алгоритмы (линейные модели, деревья, бустинги, базовые нейросети), методы оценки моделей.

Вторая фаза — индустриальная специфика. Изучите особенности временных рядов в промышленности, методы predictive maintenance, аномалии (Isolation Forest, autoencoders), Bayesian optimization для оптимизации режимов. Полезно посмотреть кейсы НЛМК и других металлургов на конференциях DataFest, Smart Industry, AI Journey. Тренажёр Карьерник помогает быстро освежать SQL и базовые алгоритмы между большими задачами подготовки.

Третья фаза — личные кейсы. Подготовьте 2–3 истории из карьеры в формате STAR. Если индустриального опыта нет, сделайте pet-проект с временными рядами (Kaggle: energy, manufacturing, sensor data). Подготовьте отдельную историю про работу со стейкхолдерами разного уровня — НЛМК ценит коммуникативную зрелость.

Частые ошибки {#chastye-oshibki}

  • Кандидат говорит про модели абстрактно, без привязки к данным и физическому смыслу. В НЛМК это режет глаз сразу.
  • Игнорирование физики процесса. DS, не понимающий, какие параметры реально влияют на качество стали, выглядит как «человек, не вникающий в задачу».
  • Слабая работа с временными рядами: data leakage, неправильный split, отсутствие учёта сезонности и смен.
  • Незнание базовой статистики. На вопросы про p-value, доверительный интервал, статистическую мощность ждут уверенных ответов.
  • Слабый SQL и нежелание думать о данных: «я обычно прошу аналитика». В современной DS-роли это красный флаг.
  • Слишком общий рассказ о проектах: «обучил модель, получил метрику». Без описания данных, валидации, причин выбора подхода — этого мало.

Связанные темы {#svyazannye-temy}

FAQ {#faq}

Сколько готовиться?

Для среднего грейда DS — 5–8 недель при наличии 1–2 лет опыта. Если опыт смежный (BA, разработчик, инженер) или академический — 3–5 месяцев на освоение Python, SQL, ML и базовой статистики.

Нужен ли промышленный опыт?

Желателен, но не обязателен. Если у вас сильная математическая база и понятные ML-проекты, специфику можно освоить за пару месяцев на рабочем месте. НЛМК берёт людей из IT, банков и научных институтов.

Какой стек у НЛМК?

Python (Pandas, NumPy, scikit-learn, бустинги), временные ряды (statsmodels, Prophet, LSTM/Transformer), PyTorch или TensorFlow для CV, MLflow для трекинга экспериментов. SQL — Oracle, Postgres, иногда специализированные промышленные хранилища.

Чем DS в НЛМК отличается от DS в Северстали?

Технологически близко, в обеих компаниях много данных от датчиков и упор на оптимизацию процессов. НЛМК исторически чуть активнее на международном рынке, в задачах больше места ценовым моделям и прогнозам спроса. Северсталь — крупный игрок в России с разнообразным портфелем активов (металл + горнодобыча).

Какие книги и ресурсы помогают?

Hastie, Tibshirani, Friedman «The Elements of Statistical Learning», курсы по временным рядам, материалы DataFest и Smart Industry, кейсы металлургов на AI Journey и Хабре.

Реально ли уйти в продакт-менеджмент из DS-роли в НЛМК?

Реально. У НЛМК большая структура и развитые продуктовые роли в коммерческом и цифровом блоках. Многие DS вырастают в продакт-менеджеров аналитических продуктов или руководителей направлений. Для перехода важно к двум-трём годам в DS-роли набрать опыт работы со стейкхолдерами и понять бизнес-метрики глубже.

Что важно знать про данные металлургии перед собеседованием?

Производственные данные металлургов — это смесь high-frequency сенсорных рядов (с печей и станов) и low-frequency лабораторных данных (анализы плавок). На собеседовании плюс — если вы понимаете, как такие потоки соединяются: одна плавка — это десятки минут процесса с сенсорной траекторией и одно/несколько лабораторных значений в конце. Это влияет на feature engineering и валидацию.

Статья основана на публичных источниках: вакансиях, отзывах кандидатов на open-площадках, профильных сообществах и общих практиках найма в промышленных компаниях. Конкретные процессы и требования могут отличаться от описанных и меняются со временем — уточняйте детали у рекрутера.