Про спам-фильтр сказали: `P(flag|spam)` 99%. Менеджер делает вывод, что `P(spam|flag)` тоже 99%. Что нужно уточнить, чтобы корректно перейти от `P(B|A)` к `P(A|B)` по `Bayes`?

Question

Карьерник · Accepted Answer

Правильный ответ: Только `P(B)`, потому что оно всегда равно 1 − `P(A)`.. `P(B|A)` не превращается в `P(A|B)` без `prior` (априорная вероятность) и `false positive` (ложноположительный результат) компоненты в знаменателе `P(B)`. Менеджер перепутал направление условной вероятности: `P(flag|spam)` описывает, как фильтр ведёт себя на спаме. Для `P(spam|flag)` нужно учитывать, как часто спам встречается (`base rate` (базовая частота событий)) и как часто фильтр ошибается на не-спаме (`false positive` (ложноположительный результат)). Без этих данных оценка `posterior` (апостериорная вероятность) легко становится сильно завышенной.

Про спам-фильтр сказали: `P(flag|spam)` 99%. Менеджер делает вывод, что `P(spam|flag)` тоже 99%. Что нужно уточнить, чтобы корректно перейти от `P(B|A)` к `P(A|B)` по `Bayes`?

Разбор

Ещё вопросы по теме «Теорема Байеса»

Про спам-фильтр сказали: P(flag|spam) 99%. Менеджер делает вывод, что P(spam|flag) тоже 99%. Что нужно уточнить, чтобы корректно перейти от P(B|A) к P(A|B) по Bayes?

Разбор

Ещё вопросы по теме «Теорема Байеса»

Про спам-фильтр сказали: `P(flag|spam)` 99%. Менеджер делает вывод, что `P(spam|flag)` тоже 99%. Что нужно уточнить, чтобы корректно перейти от `P(B|A)` к `P(A|B)` по `Bayes`?