Question 1

Событие `A` — письмо действительно спам, событие `B` — фильтр пометил письмо как спам. Какая величина отвечает на вопрос: какова вероятность, что письмо — спам, при условии, что фильтр пометил его как спам?

Accepted Answer

`P(A|B)` и `P(B|A)` отвечают на разные вопросы и обычно не равны. Вопрос сформулирован как вероятность `A` при условии `B`, то есть это `P(A|B)`. Многие путают её с `P(B|A)`, которая описывает чувствительность фильтра: как часто он помечает спам как спам. Для оценки качества решения на входящем потоке важно именно `P(A|B)`.

Question 2

Из стандартной колоды вытянули одну карту, и она оказалась красной. Какова `P(second red|first red)` при вытягивании второй карты без возвращения?

Accepted Answer

После `condition` первая карта красная меняется состав колоды, поэтому условная вероятность считается по новой базе. Если первая карта красная, в колоде остаётся 51 карта, из них красных 25. Поэтому вероятность красной второй карты при этом условии — 25 из 51. Частая ошибка — использовать исходную долю 26 из 52 и игнорировать влияние условия на оставшуюся колоду.

Question 3

Вы смотрите `contingency table` по событиям `A` и `B`. Какой шаг корректно описывает, как посчитать `P(A|B)` из таблицы?

Accepted Answer

Чтобы получить `P(A|B)` из `contingency table`, нужно делить `A∩B` на общую массу случаев с условием `B`. Условная вероятность всегда нормируется на условие, то есть на то, сколько раз встречается `B`. В таблице это означает: берём ячейку пересечения `A` и `B` и делим на сумму по строке или столбцу, соответствующему `B`. Так мы получаем долю `A` внутри всех случаев `B` и избегаем путаницы с `P(B|A)`.

Question 4

Известно, что `P(A|B)=0.2` и `P(B)=0.5`. Какая формула корректно выражает `P(A∩B)`?

Accepted Answer

`P(A∩B)` вычисляется как `P(A|B)` умножить на `P(B)`. `P(A∩B)` — это вероятность того, что в одном наблюдении произойдут и `A`, и `B`. `P(A|B)` описывает долю `A` внутри всех случаев `B`, поэтому для перехода к совместной вероятности нужно «вернуть масштаб» и умножить на `P(B)`. Это базовый мост между `P(A|B)` и `P(A∩B)`.

Question 5

В 1000 сессиях событие `B` — применён промокод — произошло 200 раз, а событие `A` — покупка — произошло 16 раз при условии `B` и 32 раза при условии `¬B`. Чему равна `P(A|¬B)`?

Accepted Answer

`P(A|¬B)` — это вероятность `A` на подвыборке, где условие `B` не выполнено. Условие `¬B` означает, что база — сессии без промокода, их 1000 − 200 = 800. Среди них покупок 32, поэтому `P(A|¬B)` равна 32 из 800, то есть 4%. Если разделить на 1000, вы получите не условную вероятность, а долю покупок в общей базе.

Условная вероятность: вопросы для собеседования (часть 2)

Вопросы 6–10 из 20

Хотите тренировать интерактивно?

Другие темы: Теория вероятностей