Собеседование на ML Engineer в Иннотех

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Иннотех — особенный работодатель для MLE

«Иннотех» — крупная российская IT-компания, входит в группу ВТБ как технологическое подразделение банка. Занимается разработкой банковских систем, ПО для финансового сектора, инфраструктуры ВТБ, инновационных продуктов. По сути «Иннотех» для ВТБ — то же, что «Сбер Тех» для Сбера: внутренний IT-провайдер, у которого есть и внешние клиенты в банковском секторе. Для ML-инженера это работа в финтехе с серьёзным регуляторным контекстом и большим объёмом banking-данных.

ML-системы: credit scoring (модели одобрения кредитов, лимитов), anti-fraud (real-time scoring транзакций), NLP для документов (анализ договоров, KYC-документов, обращений клиентов), recommendation банковских продуктов (cross-sell, upsell), churn prediction (особенно для премиум-клиентов), AML (anti-money laundering — детекция подозрительных операций).

Стек: Python + Catboost для табличных задач + PyTorch для нейросетей (NLP, sequence) + K8s для deployment + ClickHouse как аналитический движок + Hadoop для тяжёлых ETL на banking-данных + MLflow для трекинга экспериментов. Часть инфраструктуры — на ВТБ-внутренних платформах.

Актуальные вакансии — на hh.ru и сайте Иннотеха.

Информация основана на публичных источниках и опыте кандидатов. Команды Иннотеха используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

Цикл занимает 3-4 недели и включает 5-6 этапов. Иннотех — крупная корпоративная компания в группе ВТБ. Упор на production ML, fintech и compliance.

1. HR-скрининг (30-45 минут)

Рекрутер проверяет фон: production-опыт ML, fintech / banking background — большой плюс. Готовь питч на 90 секунд: проекты, бизнес-эффект, стек. Если работал в banking, scoring, anti-fraud — упомяни сразу.

2. ML-теория (60-90 минут)

Базовая секция с ведущим ML-инженером. Темы: градиентный бустинг (CatBoost — стандарт для banking scoring), credit scoring (PD/LGD/EAD, calibration, monotonic constraints), anti-fraud (class imbalance, threshold optimization), время с правом explainability. Будь готов про SHAP, monotonic constraints для regulator-compliant моделей.

Подготовка: ML-теория.

3. Python live coding (60 минут)

Live-кодинг: 1-2 задачи на алгоритмы (LeetCode Medium), плюс задача на ML-pipeline — функция для расчёта Gini / KS-statistic, реализовать temporal cross-validation. Готовиться по LeetCode минимум 3-4 недели.

Подготовка: Python для DS.

4. ML System Design (90 минут)

Кейсовая секция. Кейсы: «спроектируй credit scoring pipeline для розничного кредитования», «anti-fraud detection с low-latency», «AML monitoring для подозрительных транзакций». Нужно: уточнить бизнес-метрику и regulatory constraints, описать архитектуру, выбрать модели с explainability, продумать compliance (model risk management).

Подготовка: MLOps, Model serving, Feature stores.

5. Production / scale (60 минут)

Секция про инфраструктуру: K8s deployment, мониторинг моделей, regulator compliance (ЦБ требует audit trail и model validation). Кейсы про откат, drift, валидацию.

Подготовка: Monitoring drift, Deployment strategies.

6. Поведенческое (45 минут)

С тимлидом. STAR-формат: конфликт с продактом, факап с моделью, спор по compliance. Иннотех ценит инженерную аккуратность в регулируемой среде.

Особенности по командам

Credit scoring. Ядро banking ML: модели для одобрения кредитов и установки лимитов. Команда работает с CatBoost, regulator-compliant models (monotonic, explainable), historical data ВТБ. Подойдёт MLE с banking scoring background.

Anti-fraud. Real-time scoring транзакций. Класс imbalance, low-latency, adversarial conditions. Подойдёт тем, у кого опыт в banking anti-fraud.

AML. Anti-money laundering: детекция подозрительных операций для compliance с ЦБ-требованиями. Высокие требования к explainability. Подойдёт тем, у кого опыт в banking AML.

Document NLP. Обработка договоров, KYC-документов, обращений: OCR, classification, NER, summarization. Подойдёт MLE с NLP-опытом.

Recommendation. Cross-sell / upsell банковских продуктов: какому клиенту какой кредит, депозит, инвестицию. Recsys с учётом риск-профиля. Подойдёт тем, у кого есть recsys-опыт.

Что Иннотех ценит в MLE

Production ML. Базовое требование. Слабый — «делал на Kaggle»; сильный — «credit scoring модель на 200k заявок в месяц, Gini=0.65, deploy через K8s, регулярный retraining».

Fintech / banking context. Понимание особенностей banking ML: regulator requirements, model validation, class imbalance, explainability. Если в banking не работал — изучи Basel III, Risk Modeling.

Compliance / regulator. Знание о model risk management, model validation, audit trail. Слабый — «обучил модель, задеплоил»; сильный — «провёл model validation, документировал для регулятора, использовал monotonic constraints для compliance».

K8s. Без K8s сложно.

Catboost / PyTorch / Python. Стандарт. CatBoost — must для banking-задач из-за explainability.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 6-8 недель до собеседования:

  1. Неделя 1-2 — Python + ML + scoring. LeetCode Medium 30+ задач, credit scoring, calibration, banking metrics. Параллельно прорешай вопросы по Python, ML и SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. Python для DS, ML-теория.
  2. Неделя 3 — K8s + Docker. Подними хотя бы 1 модель в K8s.
  3. Неделя 4 — MLOps + feature stores. MLOps, Feature stores.
  4. Неделя 5 — System design + banking ML. Кейсы scoring, anti-fraud, AML. Model serving.
  5. Неделя 6 — Monitoring + deployment. Compliance, model validation. Monitoring drift.
  6. Неделя 7-8 — Mocks + behavioral. Mock-интервью, 5-7 STAR-историй.

Частые ошибки

Без fintech / banking domain. Кандидат говорит «у меня e-commerce» — на System Design отвалится. Сильный — «изучил banking scoring, понимаю regulator requirements, PD/LGD/EAD».

Без compliance понимания. Кандидат говорит «деплоил модель в K8s» — слабо для banking. Сильный — «провёл model validation, audit trail, использовал monotonic constraints».

Без K8s. «Деплоил через docker-compose» — слабо. Сильный — «деплоил через K8s с CI/CD».

Только notebook. Кандидаты с Jupyter-only валятся. Сильный — «свои проекты переписал в виде пакетов».

Без production опыта. «У нас была модель» — не история. Сильный — «scoring на 200k заявок в месяц, Gini=0.65, мониторил drift и retraining ежемесячно, провёл model validation через independent team».

Связанные темы

FAQ

Удалёнка в Иннотехе для MLE?

Гибрид и удалёнка распространены. Офисы — в Москве.

Зарплатные вилки 2026?

Middle MLE: 280-420k. Senior: 420-630k.

Английский нужен?

Базовый — желательно. Свободный — не обязателен.

Сколько этапов?

5-6 этапов, 3-4 недели.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.