Q: Для дискретной `random variable` X как интерпретировать скачок `CDF` в точке x0?

Для дискретной X скачки `CDF` равны точечным вероятностям `P(X=x)` из `PMF`. `CDF` накапливает вероятность, поэтому когда X может принять конкретное значение x0 с ненулевой вероятностью, `CDF` делает скачок. Величина скачка — это `P(X=x0)`, то есть масса в точке, которая задаётся `PMF`. Это помогает отличать дискретный случай от непрерывного, где вероятность задаётся через `PDF` и скачков обычно нет.

Q: Вы построили `CDF` для `random variable` X и увидели заметные скачки. Какое объяснение наиболее корректно?

Скачки `CDF` соответствуют ненулевым точечным вероятностям `P(X=x)`. Если X принимает некоторые значения с ненулевой вероятностью, `CDF` делает скачок на величину этой вероятности. Это типично для дискретных величин и возможно в смешанных моделях, где есть и непрерывная часть, и точечная масса. Для чисто непрерывной модели `CDF` обычно непрерывна, а для всех a выполняется `P(X=a)=0`. Поэтому скачки — сигнал проверить тип данных и определение X.

Q: Как наиболее правильно описать связь между `PDF` и `CDF` для непрерывной `random variable` X?

`CDF` — это накопленная вероятность, которую можно интерпретировать как площадь под `PDF` слева от порога. Для непрерывной X `PDF` описывает, как распределена вероятность по оси значений, а `CDF` показывает, какая доля уже накопилась до x. Поэтому `P(a<X<=b)` можно получать как площадь под `PDF` на интервале или как разность значений `CDF`. Ошибка новичка — подставлять `PDF(a)` вместо `P(X=a)`, хотя для непрерывного случая `P(X=a)=0`. Для задач с порогами и процентилями обычно удобнее работать через `CDF`.

Q: Какое утверждение правильно различает `PMF` и `PDF`?

`PMF` работает с точечными вероятностями дискретной X, а `PDF` — с площадями для непрерывной X. Для дискретной X отдельное значение может иметь ненулевую вероятность, поэтому `P(X=2)` берётся напрямую из `PMF`. Для непрерывной X точечная вероятность равна 0, и используют `PDF` или `CDF` для интервалов. Смешение этих понятий приводит к типичной ошибке: читать `PDF(x)` как `P(X=x)`. Поэтому всегда уточняйте, дискретная у вас X или непрерывная.

Question 1

Что наиболее точно описывает `PDF` для непрерывной `random variable` X (например, время ожидания)?

Accepted Answer

`PDF` описывает плотность, а вероятности для непрерывной `random variable` получаются как площадь на интервалах. Для непрерывной величины точечные вероятности вроде `P(X=1)` равны 0, поэтому `PDF` нельзя читать как вероятность в точке. Смысл `PDF` в том, что она показывает, где распределение более концентрировано, и позволяет получать `P(a<X<=b)` как площадь. Накопленная вероятность задаётся через `CDF`, которую можно интерпретировать как площадь слева от порога.

Question 2

Для дискретной `random variable` X как интерпретировать скачок `CDF` в точке x0?

Accepted Answer

Для дискретной X скачки `CDF` равны точечным вероятностям `P(X=x)` из `PMF`. `CDF` накапливает вероятность, поэтому когда X может принять конкретное значение x0 с ненулевой вероятностью, `CDF` делает скачок. Величина скачка — это `P(X=x0)`, то есть масса в точке, которая задаётся `PMF`. Это помогает отличать дискретный случай от непрерывного, где вероятность задаётся через `PDF` и скачков обычно нет.

Question 3

Вы построили `CDF` для `random variable` X и увидели заметные скачки. Какое объяснение наиболее корректно?

Accepted Answer

Скачки `CDF` соответствуют ненулевым точечным вероятностям `P(X=x)`. Если X принимает некоторые значения с ненулевой вероятностью, `CDF` делает скачок на величину этой вероятности. Это типично для дискретных величин и возможно в смешанных моделях, где есть и непрерывная часть, и точечная масса. Для чисто непрерывной модели `CDF` обычно непрерывна, а для всех a выполняется `P(X=a)=0`. Поэтому скачки — сигнал проверить тип данных и определение X.

Question 4

Как наиболее правильно описать связь между `PDF` и `CDF` для непрерывной `random variable` X?

Accepted Answer

`CDF` — это накопленная вероятность, которую можно интерпретировать как площадь под `PDF` слева от порога. Для непрерывной X `PDF` описывает, как распределена вероятность по оси значений, а `CDF` показывает, какая доля уже накопилась до x. Поэтому `P(a<X<=b)` можно получать как площадь под `PDF` на интервале или как разность значений `CDF`. Ошибка новичка — подставлять `PDF(a)` вместо `P(X=a)`, хотя для непрерывного случая `P(X=a)=0`. Для задач с порогами и процентилями обычно удобнее работать через `CDF`.

Question 5

Какое утверждение правильно различает `PMF` и `PDF`?

Accepted Answer

`PMF` работает с точечными вероятностями дискретной X, а `PDF` — с площадями для непрерывной X. Для дискретной X отдельное значение может иметь ненулевую вероятность, поэтому `P(X=2)` берётся напрямую из `PMF`. Для непрерывной X точечная вероятность равна 0, и используют `PDF` или `CDF` для интервалов. Смешение этих понятий приводит к типичной ошибке: читать `PDF(x)` как `P(X=x)`. Поэтому всегда уточняйте, дискретная у вас X или непрерывная.

Случайные величины: основы: вопросы для собеседования (часть 4)

Вопросы 16–20 из 20

Хотите тренировать интерактивно?

Другие темы: Теория вероятностей