Вопросы по теме «Теорема Байеса»

Теорема Байеса — одна из самых популярных тем на собеседовании, потому что проверяет интуицию о вероятности. Классические задачи: болезнь и тест, спам-фильтр, обновление вероятности при новых данных. Интервьюеры ценят умение рассуждать пошагово и не путать P(A|B) с P(B|A).

Всего в этом разделе 20 вопросов. Каждый — с правильным ответом и кратким разбором теории. Разбито на 4 части по 5 вопросов.

Условная вероятностьНепрерывные распределенияКомбинаторикаДискретные распределенияМатематическое ожидание и дисперсияНезависимость событийСовместные распределения и ЦПТСлучайные величины: основыМножества и события

Вопросы 15 из 20

1Пусть A — мошенничество, B — сработал алерт. Что в этой постановке означает `false positive`?
AB произошло, а A нет: алерт сработал на нормальную транзакцию.
BA произошло, а B нет: мошенничество без алерта.
CA и B произошли: алерт сработал на мошенничество.
DA не произошло и B не произошло: нормальная транзакция без алерта.
Ответ: `false positive` — это срабатывание на отсутствие события, то есть B при not A.

В контексте алертов это означает, что система подняла тревогу, хотя мошенничества не было. На уровне вероятностей это связано с `P(B|not A)`, которое часто называют `false positive rate`. При низком `base rate` даже небольшой `false positive rate` может давать много ложных тревог.

2Пусть A — болезнь, B — положительный тест. Что означает `false negative` (ложноотрицательный результат)?
AB произошло, а A нет: тест показал плюс у здорового.
BB не произошло, а A произошло: тест показал минус при наличии болезни.
CA и B произошли: тест правильно выявил болезнь.
DA не произошло и B не произошло: тест правильно исключил болезнь.
Ответ: `false negative` (ложноотрицательный результат) — это пропуск события, то есть not B при A.

В медицине это означает: тест отрицательный, хотя болезнь есть. В системах алертов — событие произошло, но сигнал не поднят. При анализе важно учитывать `P(not B|A)`, иначе можно ошибочно считать, что отрицательный результат почти полностью обнуляет `posterior`.

3Аналитик хочет ответить на вопрос: среди пользователей, которые получили пуш (событие B), какая доля совершила покупку (событие A). Какая вероятность соответствует этому вопросу?
A`P(B|A)`
B`P(B)`
C`P(A|B)`
D`P(A)`
Ответ: Вопрос «какова доля A среди тех, у кого выполнено B» соответствует `P(A|B)`.

Если B — условие отбора (пользователь получил пуш), то нас интересует вероятность A внутри этой группы. Это именно `P(A|B)`, а не `P(B|A)`, которое отвечает на обратный вопрос: как часто пуш встречается среди тех, кто купил. Подмена направления часто приводит к неверной интерпретации качества сегмента или кампании.

4Предположим, что `P(B|A)` и `P(B|not A)` фиксированы. Как изменится `posterior` (апостериорная вероятность) `P(A|B)`, если `base rate` (базовая частота событий) `P(A)` вырастет (событие A станет чаще)?
AОбязательно уменьшится, потому что вероятность делится на `P(B)`.
BОстанется прежним, потому что качество сигнала B не меняется.
CУвеличится, потому что среди объектов с B станет больше доля A.
DСтанет равным `P(B|A)` независимо от данных.
Ответ: При фиксированных `P(B|A)` и `P(B|not A)` рост `base rate` (базовая частота событий) `P(A)` увеличивает `posterior` (апостериорная вероятность) `P(A|B)`.

Когда A становится более частым, доля истинных срабатываний среди всех срабатываний растёт. В формуле `Bayes` это видно через множитель `P(A)` в числителе и через вклад `P(B|A)P(A)` в `P(B)`. Поэтому один и тот же сигнал B несёт разную информацию в разных популяциях.

5В формуле `Bayes` `P(A|B)=P(B|A)P(A)/P(B)` что означает `prior` (априорная вероятность) `P(A)`?
AЭто `posterior` (апостериорная вероятность), то есть вероятность события A после наблюдения B.
BЭто `P(B)`, то есть общая вероятность наблюдения B.
CЭто показатель `false positive` для наблюдения B.
DЭто исходная вероятность события A до наблюдения B (например, `base rate`).
Ответ: `prior` (априорная вероятность) `P(A)` — это исходная вероятность события до учёта наблюдения и ключевая часть обновления по `Bayes`.

В задачах диагностики `prior` (априорная вероятность) часто совпадает с `base rate` в популяции или с оценкой риска для конкретного сегмента. При одинаковом `P(B|A)` разные `prior` (априорная вероятность) дают разные `posterior` (апостериорная вероятность). Игнорирование `prior` (априорная вероятность) — одна из главных причин, почему интуиция ошибается в задачах `Bayes`.

1234

Хотите тренировать интерактивно?

В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.

Тренировать в Telegram

Другие темы: Теория вероятностей

Условная вероятностьНепрерывные распределенияКомбинаторикаДискретные распределенияМатематическое ожидание и дисперсияНезависимость событийСовместные распределения и ЦПТСлучайные величины: основыМножества и события