Случайные величины: основы: вопросы для собеседования (часть 2)

Что такое случайная величина, дискретная vs непрерывная, PMF, PDF, CDF — базовые понятия, без которых невозможно говорить о распределениях и статистике. На собеседовании спрашивают, чем PDF отличается от PMF, как найти вероятность через CDF и что значит «распределение случайной величины».

Теорема БайесаУсловная вероятностьНепрерывные распределенияКомбинаторикаДискретные распределенияМатематическое ожидание и дисперсияНезависимость событийСовместные распределения и ЦПТМножества и события

Вопросы 610 из 20

6Для непрерывной `random variable` X какая связь между `P(a<X<b)` и `P(a<=X<=b)`?
A`P(a<X<b)` всегда меньше, потому что строгие границы уменьшают вероятность.
B`P(a<=X<=b)` всегда меньше, потому что включает точки a и b.
C`P(a<X<b)` и `P(a<=X<=b)` равны, потому что `P(X=a)=0` и `P(X=b)=0`.
DНельзя сравнить без знания `PMF`.
Ответ: Для непрерывных X `P(a<X<b)` и `P(a<=X<=b)` совпадают, так как `P(X=a)=0` и `P(X=b)=0`.

Различие между строгими и нестрогими границами важно для дискретных величин, где `P(X=a)` может быть ненулевой. В непрерывном случае добавление или исключение граничных точек не меняет вероятность интервала. Это полезный `sanity-check`, когда вы переходите к вычислению через `CDF` или через площадь под `PDF`.

7Для дискретной `random variable` X задан `PMF`: `P(X=0)=0.25`, `P(X=1)=0.5`, `P(X=2)=0.25`. Как найти `P(X>=1)`?
A`P(X>=1)=PDF(1)`
B`P(X>=1)=P(X=1)+P(X=2)`
C`P(X>=1)=P(X=2)-P(X=0)`
D`P(X>=1)=1/P(X=0)`
Ответ: Для дискретной величины вероятность события находится суммой соответствующих значений `PMF`.

Событие `P(X>=1)` включает значения 1 и 2, поэтому нужно сложить `P(X=1)` и `P(X=2)`. Это отличается от непрерывного случая, где используют `PDF` и площадь на интервале. Здесь также можно использовать `CDF`: если известна `F(0)`, то `P(X>=1)=1-F(0)`.

8Как определить медиану m непрерывной `random variable` X через `CDF` F?
Am такое, что `F(m)=0.5`.
Bm такое, что `PDF(m)=0.5`.
Cm такое, что `P(X=m)=0.5`.
Dm всегда равна среднему значению X.
Ответ: Медиана определяется условием `F(m)=0.5` для `CDF`.

Медиана — это значение, которое делит распределение пополам по накопленной вероятности. Через `CDF` это означает, что `P(X<=m)=0.5`. Это не означает, что `P(X=m)=0.5`, потому что для непрерывного случая точечная вероятность равна 0. В реальных данных медиана и среднее могут различаться при асимметрии распределения.

9Известна `CDF` F(x) непрерывной `random variable` X. Как выразить `P(a<X<=b)` через F?
A`P(a<X<=b)=F(a)-F(b)`
B`P(a<X<=b)=F(b)-F(a)`
C`P(a<X<=b)=F(a)+F(b)`
D`P(a<X<=b)=F(a)*F(b)`
Ответ: Для `CDF` верно, что `P(a<X<=b)=F(b)-F(a)`.

`CDF` определяется как `F(x)=P(X<=x)`, то есть накопленная вероятность слева от порога. Тогда вероятность попасть между a и b — это разница накопленных вероятностей. Для непрерывных X выбор строгих или нестрогих границ обычно не меняет ответ, потому что `P(X=a)=0`.

10Известна `CDF` F(x) для `random variable` X. Как выразить `P(X>t)` через F?
A`P(X>t)=1-F(t)`
B`P(X>t)=F(t)`
C`P(X>t)=F(1-t)`
D`P(X>t)=PDF(t)`
Ответ: Хвостовая вероятность выражается через `CDF` как `P(X>t)=1-F(t)`.

По определению `F(t)=P(X<=t)`, то есть это вся вероятность слева от порога. Тогда вероятность справа — это дополнение до 1. В практике это используют для доли запросов медленнее порога или времени ожидания дольше SLA. Для дискретной величины формула тоже применима, но нужно помнить, что `P(X=t)` может быть ненулевой.

1234

Хотите тренировать интерактивно?

В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.

Тренировать в Telegram

Другие темы: Теория вероятностей

Теорема БайесаУсловная вероятностьНепрерывные распределенияКомбинаторикаДискретные распределенияМатематическое ожидание и дисперсияНезависимость событийСовместные распределения и ЦПТМножества и события