Собеседование на Data Scientist в Русал: этапы, индустриальные задачи, ошибки

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

«Русал» — один из крупнейших мировых производителей алюминия с заводами в России (Красноярск, Братск, Саяногорск и другие) и активами по добыче бокситов и производству глинозёма. Data Scientist в Русале — это специалист, который работает с одной из самых электро- и материалоёмких отраслей промышленности: процесс электролиза алюминия требует точного контроля десятков параметров, и любое улучшение метрики энергоэффективности или выхода по току — это многомиллионные эффекты в масштабах холдинга. Эта статья собрана из публичных описаний вакансий, отзывов кандидатов и общих практик найма в промышленных компаниях — её цель помочь подготовиться, а не пересказать внутренние документы.

Почему Русал — особенный работодатель {#pochemu-rusal-osobennyy-rabotodatel}

Алюминиевое производство — это уникальный домен. Электролизёр — это огромная ванна с расплавленным криолитом, через которую пропускается ток в десятки тысяч ампер. Параметры процесса (напряжение, ток, состав электролита, температура, расход глинозёма) контролируются десятками датчиков. Оптимизация — это десятые доли процента энергоэффективности или выхода по току, но на масштабах Русала это сотни миллионов рублей в год.

Для DS это означает работу в очень конкретной и осязаемой среде: каждое улучшение видно в производственных метриках, и эффект внедрения легко посчитать. Параллельно у компании есть направления глинозёмного производства, литейные цехи, прокат, фольга — то есть в холдинге много разнообразных переделов. Русал инвестирует в цифровизацию: внутренние команды по данным, программы по автоматизации, проекты с университетами и партнёрами.

Этапы собеседования {#etapy-sobesedovaniya}

Цикл найма DS в Русал обычно занимает 3–5 недель и проходит в 4 этапа.

1. HR-скрининг (25–40 минут)

Рекрутер уточняет опыт, домены (временные ряды, CV, табличные задачи), знание стека, готовность к гибридному формату работы (Москва + командировки на заводы), ожидания. Часто спрашивают про мотивацию: «почему именно алюминиевая отрасль».

2. Техническое интервью (60–90 минут)

Основной фильтр. Один-два интервьюера: ведущий DS или ML-инженер. Разбирают конкретные задачи: статистика, классические ML-алгоритмы, особенности работы с временными рядами, методы обнаружения аномалий. Часто просят на месте обсудить кейс: «есть данные с электролизёра, как ты построишь модель прогноза анодного эффекта?». Параллельно проверяют SQL и базовый Python.

3. Кейс-интервью / лайв-кодинг (60–90 минут)

В форме реальной задачи: дают синтетические или анонимизированные данные, просят за час построить базовое решение и обосновать выбор подхода. Может быть алгоритмическая задача средней сложности или практическое задание на feature engineering. Иногда — обсуждение чужого решения: «вот код модели, что не так и как улучшить?».

4. Финал с руководителем (60 минут)

Здесь акцент на зрелости, опыте, мотивации. Кандидата спрашивают о приоритетах, работе с производственниками, готовности учиться алюминиевой специфике. Часто разговор уходит в обсуждение конкретных проектов из вашего портфолио.

Особенности по командам {#osobennosti-po-komandam}

Электролизное производство

Челенджи: оптимизация работы электролизёров, прогноз и предотвращение анодных эффектов, контроль расхода глинозёма и фторидов, повышение выхода по току. Технологии: временные ряды, классический ML, методы оптимизации, иногда reinforcement learning. Кому подойдёт: DS с интересом к электрохимическим процессам и готовностью работать с технологами.

Глинозёмное производство и добыча

Челенджи: оптимизация процесса Байера, контроль качества глинозёма, прогноз содержания примесей в бокситах. Технологии: временные ряды, классический ML, химико-технологические модели. Кому подойдёт: DS с интересом к химии и готовностью работать с обогатителями и металлургами.

Прокат, литьё и фольга

Челенджи: контроль качества проката и литья, прогноз дефектов, оптимизация скоростей и температур. Технологии: Computer Vision, классический ML, временные ряды. Кому подойдёт: DS с опытом в CV или готовностью его быстро освоить.

Бизнес-аналитика и логистика

Челенджи: прогноз спроса на алюминий и продукцию переделки, оптимизация логистики, ценовые модели B2B. Технологии: Python, SQL, классические ML-модели, BI-инструменты. Кому подойдёт: DS с интересом к коммерческой аналитике.

Что Русал ценит в Data Scientist {#chto-rusal-tsenit}

В Русале ценят DS, который видит производство целиком и умеет работать в кросс-функциональных командах. Алюминиевое производство непрерывное (электролизёры работают круглосуточно, остановка крайне дорогая), поэтому от DS ждут аккуратной работы с данными и валидацией: модель, которая управляет процессом, должна быть предсказуемой в условиях шумов и износа оборудования.

Сильный кандидат на интервью говорит про задачу через бизнес-метрики: «модель снижает потребление электроэнергии на электролизёре на X%, что в масштабах серии Y миллионов рублей в год; внедрение требует доработки SCADA и согласования с технологами». Слабый рассказывает только про метрики на холдаут-выборке без объяснения, как они отражаются на производстве.

Простой пример. Постановка «прогнозировать анодные эффекты на электролизёре» — сильный DS уточняет: «как часто они возникают (раз в смену, раз в неделю)? какие параметры доступны заранее (напряжение, ток, концентрация глинозёма, температура)? в каком горизонте важен прогноз: 5 минут для оперативной реакции или 1 час для смены режима? какая цена ложной тревоги (лишний расход глинозёма) vs пропущенного события (рост расхода энергии)?». Только после этого он начинает работать.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план {#kak-gotovitsya-plan}

Подготовка строится в три фазы. Первая — общая база: Python (NumPy, Pandas, scikit-learn), SQL уверенного уровня, математическая статистика (доверительные интервалы, гипотезы, базовая вероятность), классические ML-алгоритмы (линейные модели, деревья, бустинги, базовые нейросети), методы оценки моделей.

Вторая фаза — индустриальная специфика. Изучите особенности временных рядов в промышленности, методы predictive maintenance, аномалии (Isolation Forest, autoencoders), Bayesian optimization для оптимизации режимов. Полезно посмотреть кейсы Русала и других металлургов на DataFest, Smart Industry, AI Journey. Для понимания процесса электролиза достаточно общего представления — детали быстро осваиваются на рабочем месте. Поддерживайте форму на тренажёре Карьерник — короткие 10-минутные сессии по SQL и базовым алгоритмам удобно вписываются в рабочий ритм.

Третья фаза — личные кейсы. Подготовьте 2–3 истории из карьеры в формате STAR. Если индустриального опыта нет, сделайте pet-проект с временными рядами (Kaggle: energy, manufacturing, sensor data). Подготовьте отдельную историю про работу со стейкхолдерами разного уровня — в Русале вы будете много общаться с производственниками.

Частые ошибки {#chastye-oshibki}

  • Кандидат говорит про модели абстрактно, без привязки к данным и физическому смыслу. В Русале это режет глаз сразу.
  • Игнорирование физики процесса. DS, не знающий, что такое выход по току или почему важна концентрация глинозёма, выглядит как «человек, которому всё равно».
  • Слабая работа с временными рядами: data leakage, неправильный split, отсутствие учёта сезонности и смен.
  • Незнание базовой статистики. На вопросы про p-value, доверительный интервал, статистическую мощность ждут уверенных ответов.
  • Слабый SQL — производственные данные в основном лежат в SQL-хранилищах.
  • Слишком общий рассказ о проектах: «обучил модель, получил метрику». Без описания данных, валидации, причин выбора подхода — этого мало.

Связанные темы {#svyazannye-temy}

FAQ {#faq}

Сколько готовиться?

Для среднего грейда DS — 5–8 недель при наличии 1–2 лет опыта. Если опыт смежный — 3–5 месяцев на освоение Python, SQL, ML и базовой статистики.

Нужен ли опыт в металлургии?

Желателен, но не обязателен. Если у вас сильная математическая база и понятные ML-проекты, специфику можно освоить за пару месяцев. Русал берёт людей из IT, банков, академических институтов и стартапов.

Какой стек у Русала?

Python (Pandas, NumPy, scikit-learn, бустинги), временные ряды (statsmodels, Prophet, LSTM/Transformer), PyTorch или TensorFlow для CV, MLflow для трекинга. SQL — Oracle, Postgres, иногда специализированные промышленные хранилища.

Возможна ли удалёнка?

Зависит от направления. Часть позиций — гибрид (Москва), часть — выезд на заводы. Конкретно уточняйте у рекрутера.

Какие книги и ресурсы помогают?

Hastie, Tibshirani, Friedman «The Elements of Statistical Learning», курсы по временным рядам, материалы DataFest и Smart Industry, кейсы Русала и других металлургов на AI Journey и Хабре.

Чем DS в Русале отличается от DS в чёрной металлургии?

В чёрной металлургии (Северсталь, ММК, НЛМК) основное внимание — на временных рядах процесса плавки и прокатки. В Русале процесс электролиза непрерывный и идёт сутками, поэтому больше акцента на стабильности оптимизаций и долгосрочных трендах. Энергопотребление в алюминии — критичная статья себестоимости, поэтому много задач связано с предсказанием и оптимизацией расхода электроэнергии.

Статья основана на публичных источниках: вакансиях, отзывах кандидатов на open-площадках, профильных сообществах и общих практиках найма в промышленных компаниях. Конкретные процессы и требования могут отличаться от описанных и меняются со временем — уточняйте детали у рекрутера.