14 мая 2026 г.·6 мин чтения

Собеседование на ML Engineer в Контур

Проверь себя · 1/3разбор после ответа

Что произойдёт при выполнении it = iter([]) и затем next(it)?

Содержание:

Почему Контур — особенный работодатель для MLE
Этапы собеседования
Особенности по командам
Что Контур ценит в MLE
Как готовиться: план
Частые ошибки
Связанные темы
FAQ

Почему Контур — особенный работодатель для MLE

«Контур» (СКБ Контур) — крупная российская B2B SaaS-компания с центром разработки в Екатеринбурге. Продуктовый портфель закрывает практически все B2B-нужды российского бизнеса: Контур.Эльба (бухгалтерия для ИП), Контур.Бухгалтерия (для компаний), Контур.Диадок (юридически значимый ЭДО), Контур.Экстерн (электронная отчётность), Контур.Фокус (проверка контрагентов и compliance). Через эти продукты Контур обладает уникальной B2B-телеметрией: миллионы организаций используют Контур-продукты ежедневно. Для ML-инженера это работа с огромным объёмом документов, бухгалтерских данных, поведения контрагентов.

ML-системы: NLP для документов (классификация типов документов в Диадок, извлечение реквизитов, semantic-поиск), OCR (сканы документов в Бухгалтерии и Диадоке), anti-fraud для контрагентов (Фокус — детекция «фирм-однодневок» и подозрительных компаний), classification обращений в support, anomaly detection в платежах и отчётности, автоматизация рутинных бухгалтерских задач.

Стек: Python + Catboost для табличных задач + PyTorch для нейросетей (NLP, OCR через transformers) + K8s для deployment + ClickHouse как аналитический движок + MLflow для трекинга экспериментов.

Актуальные вакансии — на hh.ru и сайте Контура.

Информация основана на публичных источниках и опыте кандидатов. Команды Контура используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

Цикл занимает 3-4 недели и включает 5-6 этапов. Контур — крупная компания с сильной инженерной культурой. Упор на NLP, document processing и B2B SaaS.

1. HR-скрининг (30-45 минут)

Рекрутер проверяет фон: production-опыт ML, B2B SaaS / документооборот / NLP background — плюс. Готовь питч 90 секунд: проекты, бизнес-эффект, стек. Если работал в B2B SaaS, document processing, бухгалтерских ML-задачах — упомяни сразу.

2. ML-теория (60-90 минут)

Базовая секция. Темы: градиентный бустинг (CatBoost), NLP (BERT, fine-tuning, NER, classification), anomaly detection. Будь готов рассказать про работу с русским языком и document processing.

Подготовка: ML-теория.

3. Python live coding (60 минут)

Live-кодинг: 1-2 задачи на алгоритмы (LeetCode Medium), плюс задача на ML-pipeline. Готовиться по LeetCode минимум 3-4 недели.

Подготовка: Python для DS.

4. ML System Design (90 минут)

Кейсовая секция. Кейсы: «document classifier для Диадок», «OCR pipeline для сканов первички», «anti-fraud для контрагентов в Фокусе». Нужно: уточнить бизнес-метрику, описать архитектуру, выбрать модели, продумать explainability (для B2B-контекста важна).

Подготовка: MLOps, Model serving, Feature stores.

5. Production / scale (60 минут)

Секция про инфраструктуру: K8s deployment, мониторинг, обновление моделей. Кейсы про откат, drift, инциденты.

Подготовка: Monitoring drift, Deployment strategies.

6. Поведенческое (45 минут)

С тимлидом. STAR-формат: конфликт с продактом, факап с моделью, спор по архитектуре. Контур ценит инженерную аккуратность и интерес к B2B-домену.

Особенности по командам

Диадок ML. Document NLP: классификация типов документов (договоры, акты, счета-фактуры), извлечение реквизитов, semantic-поиск. Огромный объём — десятки миллионов документов в Диадоке. Подойдёт MLE с NLP-опытом.

Фокус ML. Anti-fraud для контрагентов: scoring компаний, детекция «фирм-однодневок», подозрительных операций. Анализ корпоративной отчётности, связей между компаниями. Подойдёт тем, у кого опыт в anti-fraud или corporate intelligence.

Эльба / Бухгалтерия ML. Автоматизация бух-задач: предложения проводок, классификация транзакций, анализ ошибок в декларациях. Подойдёт тем, у кого опыт с табличными данными и accounting-домен.

Экстерн ML. Отчётность: автоматизация подготовки отчётов, валидация, детекция аномалий в декларациях. Compliance-фокус.

OCR / NLP. Cross-product OCR + NLP-инфраструктура для всех продуктов: распознавание сканов, документов, форм. Подойдёт MLE с CV и NLP-опытом.

Что Контур ценит в MLE

Production ML. Базовое требование. Слабый — «делал на Kaggle»; сильный — «document classifier для Диадок на 10М документов в день, accuracy 0.96, deploy через K8s».

B2B SaaS context. Понимание особенностей B2B: heterogeneity среди клиентов, разные циклы, sparse data для маленьких. Если в B2B SaaS не работал — изучи блоги Salesforce, Notion Engineering.

NLP / OCR fluency. Transformers, BERT, fine-tuning, OCR-модели. Без NLP-опыта сложно — Контур активно использует NLP.

K8s. Без K8s сложно.

Catboost / PyTorch / Python. Стандарт.

Готовься к собесу аналитика как в Duolingo

10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram

Открыть Карьерник в Telegram

Как готовиться: план

За 6-8 недель до собеседования:

Неделя 1-2 — Python + ML + NLP. LeetCode Medium 30+ задач, transformers, BERT, fine-tuning. Параллельно прорешай вопросы по Python, ML и SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. Python для DS, ML-теория.
Неделя 3 — K8s + Docker. Подними хотя бы 1 модель в K8s.
Неделя 4 — MLOps + feature stores. MLOps, Feature stores.
Неделя 5 — System design + B2B SaaS ML. Кейсы document classification, OCR, anti-fraud. Model serving.
Неделя 6 — Monitoring + deployment. Monitoring drift.
Неделя 7-8 — Mocks + behavioral. Mock-интервью, 5-7 STAR-историй.

Частые ошибки

Без B2B SaaS domain. Кандидат говорит «у меня консьюмер» — на System Design отвалится. Сильный — «понимаю B2B heterogeneity, разные циклы, sparse data».

Без NLP / OCR. Кандидат говорит «делал классификацию» — без transformers слабо. Сильный — «работал с fine-tuning BERT, OCR-pipeline через transformer-models».

Без K8s. «Деплоил через docker-compose» — слабо. Сильный — «деплоил через K8s».

Только notebook. Кандидаты с Jupyter-only валятся. Сильный — «свои проекты переписал в виде пакетов».

Без production опыта. «У нас была модель» — не история. Сильный — «document classifier на 10М документов в день, accuracy=0.96, deploy через K8s, мониторил drift раз в неделю».

Связанные темы

FAQ

Удалёнка в Контуре для MLE?

Гибрид и удалёнка распространены, главный офис в Екатеринбурге.

Зарплатные вилки 2026?

Middle MLE: 280-420k. Senior: 420-630k.

Английский нужен?

Базовый — желательно. Свободный — не обязателен.

Сколько этапов?

5-6 этапов, 3-4 недели.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.