Собеседование на Data Scientist в ЕВРАЗ: этапы, индустриальные задачи, ошибки

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

ЕВРАЗ — крупный российский металлургический и горнодобывающий холдинг с активами в стальном производстве, угольной промышленности и ванадиевом бизнесе. Data Scientist в ЕВРАЗ — это специалист, который работает с данными нескольких очень разных переделов: от угольных шахт до прокатных станов, от агломерационных машин до сортовых производств. Эта статья собрана из публичных описаний вакансий, отзывов кандидатов и общих практик найма в промышленных компаниях — её цель помочь подготовиться, а не пересказать внутренние документы.

Почему ЕВРАЗ — особенный работодатель {#pochemu-evraz-osobennyy-rabotodatel}

ЕВРАЗ — это компания с очень широким технологическим охватом. В одном холдинге есть металлургические комбинаты (ЕВРАЗ ЗСМК, ЕВРАЗ НТМК), угольные активы («Распадская», «Южкузбассуголь»), активы по добыче руды и ванадия. Для DS это означает доступ к необычно широкому спектру задач: от safety-аналитики в шахтах до оптимизации режимов на прокатке.

ЕВРАЗ публично заявил о цифровой трансформации и инвестирует в собственный data-стек. У компании есть внутренний центр компетенций по данным, программы стажировок, регулярные хакатоны и партнёрства с университетами. Для DS это означает, что вы попадаете в живую среду с понятной карьерной лестницей и возможностью переключаться между задачами по мере роста.

Этапы собеседования {#etapy-sobesedovaniya}

Цикл найма DS в ЕВРАЗ обычно занимает 3–5 недель и проходит в 4 этапа.

1. HR-скрининг (25–40 минут)

Рекрутер уточняет опыт, домены, готовность к работе в Москве, Новокузнецке, Нижнем Тагиле или удалёнке, ожидания по компенсации. Часто спрашивают про мотивацию: почему именно ЕВРАЗ, готовы ли вы работать с производственниками, есть ли опыт с временными рядами или CV.

2. Техническое интервью (60–90 минут)

Основной фильтр. Один-два интервьюера: ведущий DS или ML-инженер. Разбирают конкретные задачи: статистика, классические ML-алгоритмы, особенности работы с временными рядами, методы аномалий. Часто просят на месте обсудить кейс: «есть датчики на конвейере угольной обогатительной фабрики, как ты построишь модель?». Параллельно проверяют SQL и базовый Python.

3. Кейс-интервью / лайв-кодинг (60–90 минут)

В форме реальной задачи: дают синтетические или анонимизированные данные, просят за час построить базовое решение и обосновать выбор подхода. Иногда — обсуждение реального проекта из портфолио кандидата с детальными вопросами по архитектуре решения, метрикам, ошибкам валидации.

4. Финал с руководителем (60 минут)

Здесь акцент на зрелости, опыте, мотивации. Кандидата спрашивают о приоритетах, работе с производственниками, готовности учиться металлургической и угольной специфике. Часто разговор уходит в обсуждение конкретных проектов из вашего портфолио.

Особенности по командам {#osobennosti-po-komandam}

Стальное производство (ЗСМК, НТМК)

Челенджи: оптимизация работы доменных печей, конвертеров, ЭСПЦ, прогноз качества проката, контроль расхода материалов и энергии. Технологии: временные ряды, классический ML, методы оптимизации, иногда reinforcement learning. Кому подойдёт: DS с интересом к долгосрочным задачам и готовностью работать с технологами разных переделов.

Угольный бизнес

Челенджи: safety-аналитика (метан, обрушения, состояние горных выработок), оптимизация работы обогатительных фабрик, прогноз качества угля. Технологии: временные ряды, аномалии, иногда CV (для контроля обогащения). Кому подойдёт: DS с интересом к safety-задачам и работе с шахтными данными — это редкий и интересный домен.

Геология и добыча руды

Челенджи: прогноз содержания полезного компонента в рудном теле, оптимизация плана горных работ, предиктивка состояния карьерного транспорта. Технологии: геостатистика, машинное обучение на пространственных данных, временные ряды. Кому подойдёт: DS с математическим бэкграундом и интересом к нестандартным геопространственным задачам.

Коммерция и логистика

Челенджи: прогноз спроса на стальную и угольную продукцию, оптимизация портфеля заказов, ценовые модели B2B. Технологии: Python, SQL, классические ML-модели, BI-инструменты. Кому подойдёт: DS с интересом к коммерческой аналитике и контактом с продажами.

Что ЕВРАЗ ценит в Data Scientist {#chto-evraz-tsenit}

В ЕВРАЗ ценят DS, который видит производство целиком и умеет работать в кросс-функциональных командах. У холдинга очень разнородные активы, и DS часто переходит из одного проекта в другой — от стали к углю, от обогатительной фабрики к продажам. Это требует широкого кругозора и быстрого освоения нового домена.

Сильный кандидат на интервью говорит про задачу через бизнес-результат: «модель повышает прогноз содержания углерода в стали с точностью ±0.02% против текущих ±0.05%, что снижает риск брака на X партий в год». Слабый рассказывает только про метрики на холдаут-выборке без объяснения, как они отражаются на производстве.

Простой пример. Постановка «предсказать аварийные события в шахте» — сильный DS уточняет: «какие именно события (метан, обрушения, прорывы воды)? как часто (раз в месяц или раз в год)? какие данные доступны заранее (датчики метана, сейсмические записи, история работ)? какая стоимость false positive (остановка работ, потери) vs false negative (риск человеческих жертв)?». Без этой работы хорошей модели не построить.

ЕВРАЗ также ценит способность DS работать с разными грейдами производственников. На одной встрече может быть директор по производству и инженер-смены — оба должны понять решение. Это требует не только технических навыков, но и коммуникативной зрелости.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план {#kak-gotovitsya-plan}

Подготовка строится в три фазы. Первая — общая база: Python (NumPy, Pandas, scikit-learn), SQL уверенного уровня, математическая статистика, классические ML-алгоритмы (линейные модели, деревья, бустинги, базовые нейросети), методы оценки моделей.

Вторая фаза — индустриальная специфика. Изучите особенности временных рядов в промышленности, методы predictive maintenance, аномалии (Isolation Forest, autoencoders), Bayesian optimization. Полезно посмотреть кейсы металлургов и угольных компаний на DataFest, Smart Industry, AI Journey. Если планируете углубляться в горно-добывающий блок — почитайте основы геостатистики (kriging, conditional simulation). Поддерживайте форму на тренажёре Карьерник — он удобно закрывает SQL, статистику и базовые ML-вопросы между большими блоками подготовки.

Третья фаза — личные кейсы. Подготовьте 2–3 истории из карьеры в формате STAR. Сделайте отдельный кейс про работу со стейкхолдерами разного уровня — в ЕВРАЗ это критично. Если индустриального опыта нет, сделайте pet-проект с временными рядами или safety-датасетами (Kaggle: manufacturing, sensor data).

Частые ошибки {#chastye-oshibki}

  • Кандидат говорит про модели абстрактно, без привязки к данным и бизнес-смыслу.
  • Игнорирование физики процесса. DS, не понимающий, что такое флотация в обогащении или почему важна температура воздуха для доменного процесса, выглядит слабо.
  • Слабая работа с временными рядами: data leakage, неправильный split, отсутствие учёта сезонности и смен.
  • Незнание базовой статистики. На вопросы про p-value, доверительный интервал, статистическую мощность ждут уверенных ответов.
  • Слабый SQL — производственные данные в основном лежат в SQL-хранилищах.
  • Слишком общий рассказ о проектах: «обучил модель, получил метрику». Без описания данных, валидации, причин выбора подхода — этого мало.

Связанные темы {#svyazannye-temy}

FAQ {#faq}

Сколько готовиться?

Для среднего грейда DS — 5–8 недель при наличии 1–2 лет опыта. Если опыт смежный (BA, разработчик, инженер) или академический — 3–5 месяцев на освоение Python, SQL, ML и базовой статистики.

Нужен ли промышленный опыт?

Желателен, но не обязателен. Если у вас сильная математическая база и понятные ML-проекты, специфику можно освоить за пару месяцев. ЕВРАЗ берёт людей из IT, банков, академических институтов и стартапов.

Какие домены особенно интересны?

Уникальные для ЕВРАЗ — safety-аналитика в шахтах и геостатистика для рудных тел. Эти задачи редко встречаются в IT-компаниях, и опыт здесь даёт сильное преимущество на рынке промышленных DS-вакансий.

Возможна ли удалёнка?

Зависит от направления. Часть позиций — гибрид (Москва), часть — выезд на производственные площадки в Кузбасс, Урал или Сибирь. Конкретно уточняйте у рекрутера.

Какие книги и ресурсы помогают?

Hastie, Tibshirani, Friedman «The Elements of Statistical Learning», курсы по временным рядам, материалы DataFest и Smart Industry, кейсы металлургов на AI Journey. Для геостатистики — Goovaerts «Geostatistics for Natural Resources Evaluation».

В чём специфика shafty-аналитики в угольных активах?

Это редкий и социально важный домен. Задача — снижать риск аварий на горных работах: контроль метана, мониторинг прогибов кровли, своевременное обнаружение нештатных режимов вентиляции. Стек — временные ряды с разреженных и шумных сенсорных рядов, методы аномалий и иногда обнаружение событий. Здесь критично работать с экспертами по горному делу: их интуиция определяет, какие признаки в данных вообще имеют смысл.

Чем DS в ЕВРАЗ отличается от DS в Северстали или ММК?

ЕВРАЗ имеет более разнообразный профиль активов: классическая чёрная металлургия + угольный бизнес + добыча руды и ванадия. Это означает, что в одном холдинге DS может за карьеру поработать в нескольких очень разных доменах. У Северстали и ММК профиль чуть более «однородно металлургический», что даёт более глубокую специализацию.

Статья основана на публичных источниках: вакансиях, отзывах кандидатов на open-площадках, профильных сообществах и общих практиках найма в промышленных компаниях. Конкретные процессы и требования могут отличаться от описанных и меняются со временем — уточняйте детали у рекрутера.