Process mining на собеседовании системного аналитика
Карьерник — Duolingo для аналитиков: 10 минут в день тренируй SQL, Python, A/B, статистику, метрики и ещё 3 темы собеса. 1500+ вопросов в Telegram-боте. Бесплатно.
Содержание:
Зачем спрашивают на собесе SA
Process mining — современный инструмент анализа AS-IS. На собесе SA: «отличие process mining от BPMN», «когда применять».
Что такое process mining
Извлечение бизнес-процессов из event logs системы. Обратное к BPMN-моделированию: вместо «как должно быть» — «как реально».
Event log → Process Mining → Discovered process diagramПрименяется когда:
- Подробной документации нет / устарела.
- Реальный flow отличается от документированного.
- Хотим найти bottleneck'и, deviations.
Event log
Источник — system log с минимальной структурой:
| Case ID | Activity | Timestamp | Resource | ... |
|---|---|---|---|---|
| Order-1 | Submitted | 2026-05-01 10:00 | system | |
| Order-1 | Reviewed | 2026-05-01 14:00 | manager-A | |
| Order-1 | Approved | 2026-05-02 09:00 | manager-A | |
| Order-2 | Submitted | 2026-05-01 11:00 | system | |
| ... |
Минимум: case ID, activity name, timestamp.
Источники: ERP, CRM, ticketing, custom apps' audit logs.
3 типа
Discovery. Из логов → process model. «Как выглядит процесс?»
Conformance checking. Сравнение AS-IS (mined) с TO-BE (designed). «Где deviations?»
Enhancement. Добавление performance / role / cost analysis на mined model. «Где boтtleneck?»
Discovery
Алгоритмы извлечения process model:
- Alpha algorithm — first и simplest.
- Heuristics miner — учитывает frequency.
- Inductive miner — robust to noise, гарантирует sound model.
- Fuzzy miner — для complex / unstructured.
Output обычно в Petri net, BPMN, или DFG (directly-follows graph) форматах.
Conformance checking
Сравнение log с reference process (designed BPMN).
Метрики:
- Fitness. Какая доля trace'ов могут быть «proигрelibrate»ы model.
- Precision. Не позволяет ли model больше, чем log показывает.
- Generalization. Не overfit ли to log.
- Simplicity. Чем проще model — тем лучше.
Альтернативно — token replay или alignments для conformance.
Insight. Часто реальный процесс далёк от designed:
- Skipped steps.
- Loops, repetitions.
- Resources doing tasks not in their role.
Enhancement
Performance analysis на mined model:
- Среднее cycle time каждого шага.
- Bottleneck — где medианное time высокое.
- Resource utilization.
- Cost per case.
- Variants — какие paths наиболее частые.
Полезно для optimization.
Tools
Celonis. Лидер process mining (€). SAP-integration сильная.
Disco. Lightweight, для pilot projects.
ProM. Open source academic tool.
PM4Py. Python library для process mining.
Apromore. Open source / cloud.
SAP Signavio. Enterprise process intelligence.
В РФ: ABBYY Timeline, ProcessMI, Comindware.
Связанные темы
- BPMN gateways для SA
- UML и BPMN для SA
- AS-IS vs TO-BE для SA
- SDLC модели для SA
- Подготовка к собесу системного аналитика
FAQ
Process mining vs BPMN моделирование?
PM — извлечение из реальных данных. BPMN — design / документирование. Работают вместе: PM показывает реальность, BPMN — желаемое.
Это официальная информация?
Нет. Статья основана на работах Wil van der Aalst (отец Process Mining), документации Celonis / PM4Py.
Тренируйте системный анализ — откройте тренажёр с 1500+ вопросами для собесов.