Question 1

Пусть A — мошенничество, B — сработал алерт. Что в этой постановке означает ложная тревога (false positive)?

Accepted Answer

Ложная тревога (false positive) — это срабатывание на отсутствие события: B при отсутствии A. В контексте алертов ложная тревога — это срабатывание системы при отсутствии события. На уровне вероятностей это связано с `P(B|not A)`, которое называют долей ложных срабатываний. При низкой базовой частоте мошенничества даже небольшая доля ложных срабатываний может давать много ложных тревог в абсолюте. Пропуск мошенничества (A без B) — это уже ложноотрицательный исход, а не ложноположительный.

Question 2

Пусть событие A — у пациента есть болезнь, а событие B — тест дал положительный результат. Что соответствует ложноотрицательному результату теста?

Accepted Answer

Ложноотрицательный результат — это пропуск события: не B при A. В медицине это значит: тест отрицательный, хотя болезнь есть. В системах оповещений — событие произошло, но сигнал не сработал. При анализе важно учитывать `P(не B | A)`, иначе можно ошибочно считать, что отрицательный результат теста почти полностью обнуляет апостериорную вероятность болезни.

Question 3

Аналитик хочет ответить на вопрос: среди пользователей, которые получили пуш (событие B), какая доля совершила покупку (событие A). Какая вероятность соответствует этому вопросу?

Accepted Answer

Вопрос «какова доля A среди тех, у кого выполнено B» соответствует `P(A|B)`. Если B — условие отбора (пользователь получил пуш), то нас интересует вероятность A внутри этой группы. Это именно `P(A|B)`, а не `P(B|A)`, которое отвечает на обратный вопрос: как часто пуш встречается среди тех, кто купил. Подмена направления часто приводит к неверной интерпретации качества сегмента или кампании.

Question 4

Пусть `P(B|A)` и `P(B|not A)` фиксированы. Как изменится апостериорная вероятность `P(A|B)`, если базовая частота `P(A)` вырастет (событие A станет встречаться чаще)?

Accepted Answer

При фиксированных `P(B|A)` и `P(B|not A)` рост базовой частоты `P(A)` увеличивает апостериорную `P(A|B)`. Когда A становится более частым, среди всех срабатываний сигнала B доля истинных растёт. В формуле Байеса это видно через множитель `P(A)` в числителе и его же вклад в знаменатель `P(B) = P(B|A)P(A) + P(B|not A)(1−P(A))`. Один и тот же сигнал B несёт разную информацию в редкой и частой популяциях: чем чаще A, тем выше `P(A|B)`. Поэтому апостериорная вероятность не зависит только от качества сигнала — базовая частота критична.

Question 5

В формуле Байеса `P(A|B) = P(B|A) * P(A) / P(B)` вы хотите подставить значение `P(A)` для расчёта апостериорной вероятности. Какую именно величину нужно взять за `P(A)`?

Accepted Answer

Априорная вероятность `P(A)` — это исходная вероятность события до учёта наблюдения и ключевая часть обновления по Байесу. В задачах диагностики априорная вероятность часто совпадает с базовой частотой в популяции или с оценкой риска для конкретного сегмента. При одинаковом `P(B|A)` разные априорные вероятности дают разные апостериорные. Игнорирование априорной вероятности — одна из главных причин, почему интуиция ошибается в задачах с формулой Байеса. Апостериорная вероятность, полная вероятность `P(B)` и доля ложноположительных срабатываний — это другие величины, играющие свои роли в формуле.

Вопросы по теме «Теорема Байеса»

Вопросы 1–5 из 20

Хотите тренировать интерактивно?

Другие темы: Теория вероятностей