Про спам-фильтр сказали: P(flag|spam) 99%. Менеджер делает вывод, что P(spam|flag) тоже 99%. Что нужно уточнить, чтобы корректно перейти от P(B|A) к P(A|B) по Bayes?

AТолько P(B), потому что оно всегда равно 1 − P(A).
BТолько размер обучающей выборки, потому что он определяет posterior (апостериорная вероятность).
CТолько P(B|A), потому что этого достаточно для Bayes.
DНужны prior (априорная вероятность)/base rate (базовая частота событий) P(spam) и false positive (ложноположительный результат) через P(flag|not spam) для расчёта P(flag).
Правильный ответ. P(B|A) не превращается в P(A|B) без prior (априорная вероятность) и false positive (ложноположительный результат) компоненты в знаменателе P(B).

Разбор

Менеджер перепутал направление условной вероятности: P(flag|spam) описывает, как фильтр ведёт себя на спаме. Для P(spam|flag) нужно учитывать, как часто спам встречается (base rate (базовая частота событий)) и как часто фильтр ошибается на не-спаме (false positive (ложноположительный результат)). Без этих данных оценка posterior (апостериорная вероятность) легко становится сильно завышенной.

Проверь себя · 1/3разбор после ответа
Пусть A — мошенничество, B — сработал алерт. Что в этой постановке означает false positive?
Тренировать статистику в Telegram

Ещё вопросы по теме «Теорема Байеса»