Собеседование на ML Engineer в Контур
Содержание:
Почему Контур — особенный работодатель для MLE
«Контур» (СКБ Контур) — крупная российская B2B SaaS-компания с центром разработки в Екатеринбурге. Продуктовый портфель закрывает практически все B2B-нужды российского бизнеса: Контур.Эльба (бухгалтерия для ИП), Контур.Бухгалтерия (для компаний), Контур.Диадок (юридически значимый ЭДО), Контур.Экстерн (электронная отчётность), Контур.Фокус (проверка контрагентов и compliance). Через эти продукты Контур обладает уникальной B2B-телеметрией: миллионы организаций используют Контур-продукты ежедневно. Для ML-инженера это работа с огромным объёмом документов, бухгалтерских данных, поведения контрагентов.
ML-системы: NLP для документов (классификация типов документов в Диадок, извлечение реквизитов, semantic-поиск), OCR (сканы документов в Бухгалтерии и Диадоке), anti-fraud для контрагентов (Фокус — детекция «фирм-однодневок» и подозрительных компаний), classification обращений в support, anomaly detection в платежах и отчётности, автоматизация рутинных бухгалтерских задач.
Стек: Python + Catboost для табличных задач + PyTorch для нейросетей (NLP, OCR через transformers) + K8s для deployment + ClickHouse как аналитический движок + MLflow для трекинга экспериментов.
Актуальные вакансии — на hh.ru и сайте Контура.
Информация основана на публичных источниках и опыте кандидатов. Команды Контура используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл занимает 3-4 недели и включает 5-6 этапов. Контур — крупная компания с сильной инженерной культурой. Упор на NLP, document processing и B2B SaaS.
1. HR-скрининг (30-45 минут)
Рекрутер проверяет фон: production-опыт ML, B2B SaaS / документооборот / NLP background — плюс. Готовь питч 90 секунд: проекты, бизнес-эффект, стек. Если работал в B2B SaaS, document processing, бухгалтерских ML-задачах — упомяни сразу.
2. ML-теория (60-90 минут)
Базовая секция. Темы: градиентный бустинг (CatBoost), NLP (BERT, fine-tuning, NER, classification), anomaly detection. Будь готов рассказать про работу с русским языком и document processing.
Подготовка: ML-теория.
3. Python live coding (60 минут)
Live-кодинг: 1-2 задачи на алгоритмы (LeetCode Medium), плюс задача на ML-pipeline. Готовиться по LeetCode минимум 3-4 недели.
Подготовка: Python для DS.
4. ML System Design (90 минут)
Кейсовая секция. Кейсы: «document classifier для Диадок», «OCR pipeline для сканов первички», «anti-fraud для контрагентов в Фокусе». Нужно: уточнить бизнес-метрику, описать архитектуру, выбрать модели, продумать explainability (для B2B-контекста важна).
Подготовка: MLOps, Model serving, Feature stores.
5. Production / scale (60 минут)
Секция про инфраструктуру: K8s deployment, мониторинг, обновление моделей. Кейсы про откат, drift, инциденты.
Подготовка: Monitoring drift, Deployment strategies.
6. Поведенческое (45 минут)
С тимлидом. STAR-формат: конфликт с продактом, факап с моделью, спор по архитектуре. Контур ценит инженерную аккуратность и интерес к B2B-домену.
Особенности по командам
Диадок ML. Document NLP: классификация типов документов (договоры, акты, счета-фактуры), извлечение реквизитов, semantic-поиск. Огромный объём — десятки миллионов документов в Диадоке. Подойдёт MLE с NLP-опытом.
Фокус ML. Anti-fraud для контрагентов: scoring компаний, детекция «фирм-однодневок», подозрительных операций. Анализ корпоративной отчётности, связей между компаниями. Подойдёт тем, у кого опыт в anti-fraud или corporate intelligence.
Эльба / Бухгалтерия ML. Автоматизация бух-задач: предложения проводок, классификация транзакций, анализ ошибок в декларациях. Подойдёт тем, у кого опыт с табличными данными и accounting-домен.
Экстерн ML. Отчётность: автоматизация подготовки отчётов, валидация, детекция аномалий в декларациях. Compliance-фокус.
OCR / NLP. Cross-product OCR + NLP-инфраструктура для всех продуктов: распознавание сканов, документов, форм. Подойдёт MLE с CV и NLP-опытом.
Что Контур ценит в MLE
Production ML. Базовое требование. Слабый — «делал на Kaggle»; сильный — «document classifier для Диадок на 10М документов в день, accuracy 0.96, deploy через K8s».
B2B SaaS context. Понимание особенностей B2B: heterogeneity среди клиентов, разные циклы, sparse data для маленьких. Если в B2B SaaS не работал — изучи блоги Salesforce, Notion Engineering.
NLP / OCR fluency. Transformers, BERT, fine-tuning, OCR-модели. Без NLP-опыта сложно — Контур активно использует NLP.
K8s. Без K8s сложно.
Catboost / PyTorch / Python. Стандарт.
Как готовиться: план
За 6-8 недель до собеседования:
- Неделя 1-2 — Python + ML + NLP. LeetCode Medium 30+ задач, transformers, BERT, fine-tuning. Параллельно прорешай вопросы по Python, ML и SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. Python для DS, ML-теория.
- Неделя 3 — K8s + Docker. Подними хотя бы 1 модель в K8s.
- Неделя 4 — MLOps + feature stores. MLOps, Feature stores.
- Неделя 5 — System design + B2B SaaS ML. Кейсы document classification, OCR, anti-fraud. Model serving.
- Неделя 6 — Monitoring + deployment. Monitoring drift.
- Неделя 7-8 — Mocks + behavioral. Mock-интервью, 5-7 STAR-историй.
Частые ошибки
Без B2B SaaS domain. Кандидат говорит «у меня консьюмер» — на System Design отвалится. Сильный — «понимаю B2B heterogeneity, разные циклы, sparse data».
Без NLP / OCR. Кандидат говорит «делал классификацию» — без transformers слабо. Сильный — «работал с fine-tuning BERT, OCR-pipeline через transformer-models».
Без K8s. «Деплоил через docker-compose» — слабо. Сильный — «деплоил через K8s».
Только notebook. Кандидаты с Jupyter-only валятся. Сильный — «свои проекты переписал в виде пакетов».
Без production опыта. «У нас была модель» — не история. Сильный — «document classifier на 10М документов в день, accuracy=0.96, deploy через K8s, мониторил drift раз в неделю».
Связанные темы
- Собеседование на ML Engineer
- MLOps
- Feature stores
- Model serving
- Monitoring и drift
- Deployment strategies
FAQ
Удалёнка в Контуре для MLE?
Гибрид и удалёнка распространены, главный офис в Екатеринбурге.
Зарплатные вилки 2026?
Middle MLE: 280-420k. Senior: 420-630k.
Английский нужен?
Базовый — желательно. Свободный — не обязателен.
Сколько этапов?
5-6 этапов, 3-4 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.