Случайные величины: основы: вопросы для собеседования (часть 4)

Что такое случайная величина, дискретная vs непрерывная, PMF, PDF, CDF — базовые понятия, без которых невозможно говорить о распределениях и статистике. На собеседовании спрашивают, чем PDF отличается от PMF, как найти вероятность через CDF и что значит «распределение случайной величины».

Теорема БайесаУсловная вероятностьНепрерывные распределенияКомбинаторикаДискретные распределенияМатематическое ожидание и дисперсияНезависимость событийСовместные распределения и ЦПТМножества и события

Вопросы 1620 из 20

16Что наиболее точно описывает `PDF` для непрерывной `random variable` X (например, время ожидания)?
A`PDF` возвращает `P(X=x)` для каждого x.
B`PDF` — это то же самое, что `PMF`, только для больших чисел.
C`PDF` равна `CDF`.
D`PDF` — функция, для которой `P(a<X<=b)` равна площади под `PDF` на интервале (a,b).
Ответ: `PDF` описывает плотность, а вероятности для непрерывной `random variable` получаются как площадь на интервалах.

Для непрерывной величины точечные вероятности вроде `P(X=1)` равны 0, поэтому `PDF` нельзя читать как вероятность в точке. Смысл `PDF` в том, что она показывает, где распределение более концентрировано, и позволяет получать `P(a<X<=b)` как площадь. Накопленная вероятность задаётся через `CDF`, которую можно интерпретировать как площадь слева от порога.

17Для дискретной `random variable` X как интерпретировать скачок `CDF` в точке x0?
AРазмер скачка равен `P(X=x0)` и совпадает с массой из `PMF` в x0.
BСкачок равен `PDF(x0)`.
CСкачок показывает `P(X<=x0)`.
DСкачки бывают только у непрерывных величин.
Ответ: Для дискретной X скачки `CDF` равны точечным вероятностям `P(X=x)` из `PMF`.

`CDF` накапливает вероятность, поэтому когда X может принять конкретное значение x0 с ненулевой вероятностью, `CDF` делает скачок. Величина скачка — это `P(X=x0)`, то есть масса в точке, которая задаётся `PMF`. Это помогает отличать дискретный случай от непрерывного, где вероятность задаётся через `PDF` и скачков обычно нет.

18Вы построили `CDF` для `random variable` X и увидели заметные скачки. Какое объяснение наиболее корректно?
AЭто значит, что X обязательно непрерывная.
BЭто значит, что `PDF` равна 0 везде.
CСкачки в `CDF` обычно означают, что у X есть значения с ненулевым `P(X=x)` (дискретная или смешанная модель).
DСкачки невозможны, значит график всегда построен неверно.
Ответ: Скачки `CDF` соответствуют ненулевым точечным вероятностям `P(X=x)`.

Если X принимает некоторые значения с ненулевой вероятностью, `CDF` делает скачок на величину этой вероятности. Это типично для дискретных величин и возможно в смешанных моделях, где есть и непрерывная часть, и точечная масса. Для чисто непрерывной модели `CDF` обычно непрерывна, а для всех a выполняется `P(X=a)=0`. Поэтому скачки — сигнал проверить тип данных и определение X.

19Как наиболее правильно описать связь между `PDF` и `CDF` для непрерывной `random variable` X?
A`CDF` равна `P(X=x)` для каждого x.
B`PDF` равна `P(X<=x)`.
C`PDF` задаёт `P(X=a)` напрямую, поэтому `P(X=a)=PDF(a)`.
D`CDF` в точке x равна накопленной площади под `PDF` слева от x, то есть `F(x)=P(X<=x)`.
Ответ: `CDF` — это накопленная вероятность, которую можно интерпретировать как площадь под `PDF` слева от порога.

Для непрерывной X `PDF` описывает, как распределена вероятность по оси значений, а `CDF` показывает, какая доля уже накопилась до x. Поэтому `P(a<X<=b)` можно получать как площадь под `PDF` на интервале или как разность значений `CDF`. Ошибка новичка — подставлять `PDF(a)` вместо `P(X=a)`, хотя для непрерывного случая `P(X=a)=0`. Для задач с порогами и процентилями обычно удобнее работать через `CDF`.

20Какое утверждение правильно различает `PMF` и `PDF`?
A`PMF` и `PDF` одинаковы, просто пишутся разными буквами.
B`PMF` даёт `P(X=x)` для дискретной X, а `PDF` используется для вероятностей интервалов, потому что для непрерывной X `P(X=x)=0`.
C`PDF` используется только для монеты, а `PMF` только для времени ожидания.
D`CDF` существует только в дискретном случае.
Ответ: `PMF` работает с точечными вероятностями дискретной X, а `PDF` — с площадями для непрерывной X.

Для дискретной X отдельное значение может иметь ненулевую вероятность, поэтому `P(X=2)` берётся напрямую из `PMF`. Для непрерывной X точечная вероятность равна 0, и используют `PDF` или `CDF` для интервалов. Смешение этих понятий приводит к типичной ошибке: читать `PDF(x)` как `P(X=x)`. Поэтому всегда уточняйте, дискретная у вас X или непрерывная.

1234

Хотите тренировать интерактивно?

В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.

Тренировать в Telegram

Другие темы: Теория вероятностей

Теорема БайесаУсловная вероятностьНепрерывные распределенияКомбинаторикаДискретные распределенияМатематическое ожидание и дисперсияНезависимость событийСовместные распределения и ЦПТМножества и события