Process mining на собеседовании системного аналитика

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Карьерник — Duolingo для аналитиков: 10 минут в день тренируй SQL, Python, A/B, статистику, метрики и ещё 3 темы собеса. 1500+ вопросов в Telegram-боте. Бесплатно.

Зачем спрашивают на собесе SA

Process mining — современный инструмент анализа AS-IS. На собесе SA: «отличие process mining от BPMN», «когда применять».

Что такое process mining

Извлечение бизнес-процессов из event logs системы. Обратное к BPMN-моделированию: вместо «как должно быть» — «как реально».

Event log → Process Mining → Discovered process diagram

Применяется когда:

  • Подробной документации нет / устарела.
  • Реальный flow отличается от документированного.
  • Хотим найти bottleneck'и, deviations.

Event log

Источник — system log с минимальной структурой:

Case ID Activity Timestamp Resource ...
Order-1 Submitted 2026-05-01 10:00 system
Order-1 Reviewed 2026-05-01 14:00 manager-A
Order-1 Approved 2026-05-02 09:00 manager-A
Order-2 Submitted 2026-05-01 11:00 system
...

Минимум: case ID, activity name, timestamp.

Источники: ERP, CRM, ticketing, custom apps' audit logs.

3 типа

Discovery. Из логов → process model. «Как выглядит процесс?»

Conformance checking. Сравнение AS-IS (mined) с TO-BE (designed). «Где deviations?»

Enhancement. Добавление performance / role / cost analysis на mined model. «Где boтtleneck?»

Discovery

Алгоритмы извлечения process model:

  • Alpha algorithm — first и simplest.
  • Heuristics miner — учитывает frequency.
  • Inductive miner — robust to noise, гарантирует sound model.
  • Fuzzy miner — для complex / unstructured.

Output обычно в Petri net, BPMN, или DFG (directly-follows graph) форматах.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Conformance checking

Сравнение log с reference process (designed BPMN).

Метрики:

  • Fitness. Какая доля trace'ов могут быть «proигрelibrate»ы model.
  • Precision. Не позволяет ли model больше, чем log показывает.
  • Generalization. Не overfit ли to log.
  • Simplicity. Чем проще model — тем лучше.

Альтернативно — token replay или alignments для conformance.

Insight. Часто реальный процесс далёк от designed:

  • Skipped steps.
  • Loops, repetitions.
  • Resources doing tasks not in their role.

Enhancement

Performance analysis на mined model:

  • Среднее cycle time каждого шага.
  • Bottleneck — где medианное time высокое.
  • Resource utilization.
  • Cost per case.
  • Variants — какие paths наиболее частые.

Полезно для optimization.

Tools

Celonis. Лидер process mining (€). SAP-integration сильная.

Disco. Lightweight, для pilot projects.

ProM. Open source academic tool.

PM4Py. Python library для process mining.

Apromore. Open source / cloud.

SAP Signavio. Enterprise process intelligence.

В РФ: ABBYY Timeline, ProcessMI, Comindware.

Связанные темы

FAQ

Process mining vs BPMN моделирование?

PM — извлечение из реальных данных. BPMN — design / документирование. Работают вместе: PM показывает реальность, BPMN — желаемое.

Это официальная информация?

Нет. Статья основана на работах Wil van der Aalst (отец Process Mining), документации Celonis / PM4Py.


Тренируйте системный анализ — откройте тренажёр с 1500+ вопросами для собесов.