Про спам-фильтр сказали: P(flag|spam) равна 99%. Менеджер делает вывод, что P(spam|flag) тоже 99%. Что нужно уточнить, чтобы корректно перейти от P(B|A) к P(A|B) по формуле Байеса?
AТолько
P(B) и P(A), потому что P(B) можно получить как 1 − P(A), и этого достаточно, чтобы перевернуть условную вероятностьBТолько размер обучающей выборки
N и точность accuracy, потому что объём данных полностью определяет апостериорную вероятность P(spam|flag)CТолько
P(B|A) и P(A), потому что чувствительности фильтра и базовой доли спама достаточно для расчёта P(A|B) без других компонентDНужны априорная вероятность
P(spam) (базовая частота) и вероятность ложноположительного срабатывания P(flag|not spam) для расчёта P(flag)Правильный ответ.
P(B|A) не превращается в P(A|B) без априорной вероятности и доли ложноположительных в знаменателе P(B).Разбор
Менеджер перепутал направление условной вероятности: P(flag|spam) описывает, как фильтр ведёт себя на спаме. Для P(spam|flag) нужно учитывать, как часто спам встречается (базовая частота) и как часто фильтр ошибается на не-спаме (ложноположительный результат). Без этих данных оценка апостериорной вероятности легко становится сильно завышенной. Размер обучающей выборки сюда не входит, а P(B) нельзя получить как 1 − P(A) — это разные события.
Проверь себя · 1/3разбор после ответа
Пусть A — болезнь, B — положительный тест. Известно:
P(A) = 0.01, P(B|A) = 0.9, P(B|not A) = 0.05. Примерно чему равно P(A|B)?Ещё вопросы по теме «Теорема Байеса»
- В задаче диагностики пусть A — наличие болезни, а B — положительный тест. Какое утверждение лучше всего объясняет разницу между `P(A|B)` и `P(B|A)`?
- Тест на редкую болезнь имеет высокую чувствительность `P(test+|disease)=99%` и низкую долю ложноположительных `P(test+|¬disease)=1%`. Болезнь встречается у 0.1% людей. Почему апостериорная `P(disease|test+)` может быть заметно ниже 99%?
- Пусть A — болезнь, B — положительный тест. Известно: `P(A) = 0.01`, `P(B|A) = 0.9`, `P(B|not A) = 0.05`. Примерно чему равно `P(A|B)`?
- В антифроде событие A — транзакция мошенническая, событие B — сработал алерт. Какая формула корректно выражает `P(B)` через формулу полной вероятности?
- Пусть A — мошенничество, B — сработал алерт. Что в этой постановке означает ложная тревога (false positive)?
- Все вопросы по «Теорема Байеса» →