Антифрод ставит флаг на транзакции: P(flag|fraud)=0.9, P(flag|¬fraud)=0.05, а base rate мошенничества P(fraud)=0.01. Какой порядок величины у P(fraud|flag)?

AОколо 90%
BОколо 15%
CОколо 5%
DОколо 1%
Правильный ответ. Высокое P(flag|fraud) не означает высокое P(fraud|flag), потому что важен base rate P(fraud).

Разбор

Даже хороший классификатор может давать много ложных флагов, если мошенничество редкое. При P(fraud)=0.01 большинство транзакций честные, и 5% ложных срабатываний на большой базе дают много сигналов. Поэтому среди флагнутых доля реального мошенничества получается порядка 15%, а не 90%.

Проверь себя · 1/3разбор после ответа
В каком случае выполняется равенство P(A|B)=P(A) при P(B)>0?
Тренировать статистику в Telegram

Ещё вопросы по теме «Условная вероятность»