Q: Для непрерывной `random variable` X какая связь между `P(a<X<b)` и `P(a<=X<=b)`?

Для непрерывных X `P(a<X<b)` и `P(a<=X<=b)` совпадают, так как `P(X=a)=0` и `P(X=b)=0`. Различие между строгими и нестрогими границами важно для дискретных величин, где `P(X=a)` может быть ненулевой. В непрерывном случае добавление или исключение граничных точек не меняет вероятность интервала. Это полезный `sanity-check`, когда вы переходите к вычислению через `CDF` или через площадь под `PDF`.

Q: Известна `CDF` F(x) непрерывной `random variable` X. Как выразить `P(a<X<=b)` через F?

Для `CDF` верно, что `P(a<X<=b)=F(b)-F(a)`. `CDF` определяется как `F(x)=P(X<=x)`, то есть накопленная вероятность слева от порога. Тогда вероятность попасть между a и b — это разница накопленных вероятностей. Для непрерывных X выбор строгих или нестрогих границ обычно не меняет ответ, потому что `P(X=a)=0`.

Question 1

Для непрерывной `random variable` X какая связь между `P(a<X<b)` и `P(a<=X<=b)`?

Accepted Answer

Для непрерывных X `P(a<X<b)` и `P(a<=X<=b)` совпадают, так как `P(X=a)=0` и `P(X=b)=0`. Различие между строгими и нестрогими границами важно для дискретных величин, где `P(X=a)` может быть ненулевой. В непрерывном случае добавление или исключение граничных точек не меняет вероятность интервала. Это полезный `sanity-check`, когда вы переходите к вычислению через `CDF` или через площадь под `PDF`.

Question 2

Для дискретной `random variable` X задан `PMF`: `P(X=0)=0.25`, `P(X=1)=0.5`, `P(X=2)=0.25`. Как найти `P(X>=1)`?

Accepted Answer

Для дискретной величины вероятность события находится суммой соответствующих значений `PMF`. Событие `P(X>=1)` включает значения 1 и 2, поэтому нужно сложить `P(X=1)` и `P(X=2)`. Это отличается от непрерывного случая, где используют `PDF` и площадь на интервале. Здесь также можно использовать `CDF`: если известна `F(0)`, то `P(X>=1)=1-F(0)`.

Question 3

Как определить медиану m непрерывной `random variable` X через `CDF` F?

Accepted Answer

Медиана определяется условием `F(m)=0.5` для `CDF`. Медиана — это значение, которое делит распределение пополам по накопленной вероятности. Через `CDF` это означает, что `P(X<=m)=0.5`. Это не означает, что `P(X=m)=0.5`, потому что для непрерывного случая точечная вероятность равна 0. В реальных данных медиана и среднее могут различаться при асимметрии распределения.

Question 4

Известна `CDF` F(x) непрерывной `random variable` X. Как выразить `P(a<X<=b)` через F?

Accepted Answer

Для `CDF` верно, что `P(a<X<=b)=F(b)-F(a)`. `CDF` определяется как `F(x)=P(X<=x)`, то есть накопленная вероятность слева от порога. Тогда вероятность попасть между a и b — это разница накопленных вероятностей. Для непрерывных X выбор строгих или нестрогих границ обычно не меняет ответ, потому что `P(X=a)=0`.

Question 5

Известна `CDF` F(x) для `random variable` X. Как выразить `P(X>t)` через F?

Accepted Answer

Хвостовая вероятность выражается через `CDF` как `P(X>t)=1-F(t)`. По определению `F(t)=P(X<=t)`, то есть это вся вероятность слева от порога. Тогда вероятность справа — это дополнение до 1. В практике это используют для доли запросов медленнее порога или времени ожидания дольше SLA. Для дискретной величины формула тоже применима, но нужно помнить, что `P(X=t)` может быть ненулевой.

Случайные величины: основы: вопросы для собеседования (часть 2)

Вопросы 6–10 из 20

Хотите тренировать интерактивно?

Другие темы: Теория вероятностей