Условная вероятность: вопросы для собеседования (часть 2)

Условная вероятность P(A|B) — основа для понимания зависимости событий и байесовского обновления. На собеседовании дают задачи, где нужно правильно обусловить вероятность — например, какова вероятность второго орла, если первый уже выпал. Ошибки в условной вероятности ведут к неверным выводам в любом анализе.

Теорема БайесаНепрерывные распределенияКомбинаторикаДискретные распределенияМатематическое ожидание и дисперсияНезависимость событийСовместные распределения и ЦПТСлучайные величины: основыМножества и события

Вопросы 610 из 20

6Событие `A` — письмо действительно спам, событие `B` — фильтр пометил письмо как спам. Какая величина отвечает на вопрос: какова вероятность, что письмо — спам, при условии, что фильтр пометил его как спам?
A`P(B|A)`
B`P(A|B)`
C`P(A∩B)`
D`P(B)`
Ответ: `P(A|B)` и `P(B|A)` отвечают на разные вопросы и обычно не равны.

Вопрос сформулирован как вероятность `A` при условии `B`, то есть это `P(A|B)`. Многие путают её с `P(B|A)`, которая описывает чувствительность фильтра: как часто он помечает спам как спам. Для оценки качества решения на входящем потоке важно именно `P(A|B)`.

7Из стандартной колоды вытянули одну карту, и она оказалась красной. Какова `P(second red|first red)` при вытягивании второй карты без возвращения?
A26 из 52
B25 из 52
C26 из 51
D25 из 51
Ответ: После `condition` первая карта красная меняется состав колоды, поэтому условная вероятность считается по новой базе.

Если первая карта красная, в колоде остаётся 51 карта, из них красных 25. Поэтому вероятность красной второй карты при этом условии — 25 из 51. Частая ошибка — использовать исходную долю 26 из 52 и игнорировать влияние условия на оставшуюся колоду.

8Вы смотрите `contingency table` по событиям `A` и `B`. Какой шаг корректно описывает, как посчитать `P(A|B)` из таблицы?
AВзять `P(A)` и разделить на `P(B)`
BВзять `P(B|A)` и использовать его как `P(A|B)`
CРазделить `P(A∩B)` на `P(A∩B)` и получить 1
DВзять значение для `A∩B` и разделить на сумму всех ячеек, где выполнено `condition` `B`
Ответ: Чтобы получить `P(A|B)` из `contingency table`, нужно делить `A∩B` на общую массу случаев с условием `B`.

Условная вероятность всегда нормируется на условие, то есть на то, сколько раз встречается `B`. В таблице это означает: берём ячейку пересечения `A` и `B` и делим на сумму по строке или столбцу, соответствующему `B`. Так мы получаем долю `A` внутри всех случаев `B` и избегаем путаницы с `P(B|A)`.

9Известно, что `P(A|B)=0.2` и `P(B)=0.5`. Какая формула корректно выражает `P(A∩B)`?
A`P(A∩B)=P(A)+P(B)`
B`P(A∩B)=P(A)/P(B)`
C`P(A∩B)=P(A|B) * P(B)`
D`P(A∩B)=P(B|A) * P(B)`
Ответ: `P(A∩B)` вычисляется как `P(A|B)` умножить на `P(B)`.

`P(A∩B)` — это вероятность того, что в одном наблюдении произойдут и `A`, и `B`. `P(A|B)` описывает долю `A` внутри всех случаев `B`, поэтому для перехода к совместной вероятности нужно «вернуть масштаб» и умножить на `P(B)`. Это базовый мост между `P(A|B)` и `P(A∩B)`.

10В 1000 сессиях событие `B` — применён промокод — произошло 200 раз, а событие `A` — покупка — произошло 16 раз при условии `B` и 32 раза при условии `¬B`. Чему равна `P(A|¬B)`?
A8%
B4.8%
C4%
D3.2%
Ответ: `P(A|¬B)` — это вероятность `A` на подвыборке, где условие `B` не выполнено.

Условие `¬B` означает, что база — сессии без промокода, их 1000 − 200 = 800. Среди них покупок 32, поэтому `P(A|¬B)` равна 32 из 800, то есть 4%. Если разделить на 1000, вы получите не условную вероятность, а долю покупок в общей базе.

1234

Хотите тренировать интерактивно?

В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.

Тренировать в Telegram

Другие темы: Теория вероятностей

Теорема БайесаНепрерывные распределенияКомбинаторикаДискретные распределенияМатематическое ожидание и дисперсияНезависимость событийСовместные распределения и ЦПТСлучайные величины: основыМножества и события