Question 1

Есть два независимых теста, каждый даёт некоторый `false positive` (ложноположительный результат) и некоторый `P(test+|disease)`. Если оба теста показали плюс, как обычно изменится `posterior` (апостериорная вероятность) `P(disease|++)` по сравнению с `P(disease|+)` после одного плюса?

Accepted Answer

При независимых доказательствах `posterior` (апостериорная вероятность) обычно растёт, потому что совместное совпадение двух плюсов у not A менее вероятно. Положительный результат — это наблюдение B, которое переводит `prior` в `posterior` (апостериорная вероятность) через `Bayes`. Второй независимый положительный результат добавляет ещё одно наблюдение и снова обновляет вероятность. Интуитивно: два совпадающих сигнала сложнее объяснить двумя `false positive` (ложноположительный результат), чем одним.

Question 2

Тест на событие A имеет ненулевой `false negative` (ложноотрицательный результат) (то есть `P(not B|A)` не равно нулю). После отрицательного результата (not B) какой вывод про `P(A|not B)` корректен?

Accepted Answer

Отрицательный результат снижает `posterior`, но при существенном `prior` и ненулевом `false negative` (ложноотрицательный результат) вероятность может оставаться не нулевой. Связь вероятностей задаёт `Bayes`: `P(A|not B)=P(not B|A)P(A)/P(not B)`. Если `false negative` (ложноотрицательный результат) велик или `base rate` высок, отрицательный тест не исключает событие полностью. Поэтому в практике используют повторные тесты или дополнительные признаки, а не один результат.

Question 3

В антифроде `base rate` (базовая частота событий) мошенничества `P(fraud)` равен 0.5%. Детектор даёт `P(alert|fraud)` 90% и `P(alert|not fraud)` 2% (`false positive` (ложноположительный результат)). Если алерт сработал, примерно чему равно `P(fraud|alert)`?

Accepted Answer

Даже при высокой `P(B|A)` низкий `base rate` (базовая частота событий) и ненулевой `false positive` (ложноположительный результат) могут сделать `P(A|B)` умеренным. Считайте `P(alert)=P(alert|fraud)P(fraud)+P(alert|not fraud)P(not fraud)` и затем применяйте `Bayes`. В примере значительная часть алертов приходит от обычных транзакций, потому что их намного больше. Поэтому `posterior` после алерта заметно ниже, чем `P(alert|fraud)`.

Question 4

В каких случаях может выполниться равенство `P(A|B)=P(B|A)` (при `P(A)>0` и `P(B)>0`)?

Accepted Answer

Из формулы `Bayes` следует, что равенство `P(A|B)=P(B|A)` возможно лишь в особых случаях, например когда `P(A)=P(B)`. Из `P(A|B)=P(B|A)P(A)/P(B)` видно, что для равенства нужно, чтобы отношение `P(A)/P(B)` было равно 1. Независимость даёт `P(A|B)=P(A)` и `P(B|A)=P(B)`, но это не делает их равными автоматически. Поэтому в реальных задачах обычно нельзя заменять одну условную вероятность другой.

Question 5

Алерт B может быть вызван мошенничеством A или независимым сбоем системы E. Почему при оценке `P(A|B)` нельзя опираться только на `P(B|A)`?

Accepted Answer

В `Bayes` знаменатель `P(B)` должен учитывать все причины появления B, иначе `posterior` (апостериорная вероятность) будет смещён. Если B может появляться по разным причинам, то B не является однозначным индикатором A. Тогда `P(B)` нужно считать по полной вероятности, добавляя вклад альтернативных причин и `false positive` (ложноположительный результат) на not A. Иначе вы фактически предполагаете, что B почти всегда означает A, что редко верно в продакшене.

Теорема Байеса: вопросы для собеседования (часть 4)

Вопросы 16–20 из 20

Хотите тренировать интерактивно?

Другие темы: Теория вероятностей