Что такое случайная величина, дискретная vs непрерывная, PMF, PDF, CDF — базовые понятия, без которых невозможно говорить о распределениях и статистике. На собеседовании спрашивают, чем PDF отличается от PMF, как найти вероятность через CDF и что значит «распределение случайной величины».
Для непрерывной величины точечные вероятности вроде `P(X=1)` равны 0, поэтому `PDF` нельзя читать как вероятность в точке. Смысл `PDF` в том, что она показывает, где распределение более концентрировано, и позволяет получать `P(a<X<=b)` как площадь. Накопленная вероятность задаётся через `CDF`, которую можно интерпретировать как площадь слева от порога.
`CDF` накапливает вероятность, поэтому когда X может принять конкретное значение x0 с ненулевой вероятностью, `CDF` делает скачок. Величина скачка — это `P(X=x0)`, то есть масса в точке, которая задаётся `PMF`. Это помогает отличать дискретный случай от непрерывного, где вероятность задаётся через `PDF` и скачков обычно нет.
Если X принимает некоторые значения с ненулевой вероятностью, `CDF` делает скачок на величину этой вероятности. Это типично для дискретных величин и возможно в смешанных моделях, где есть и непрерывная часть, и точечная масса. Для чисто непрерывной модели `CDF` обычно непрерывна, а для всех a выполняется `P(X=a)=0`. Поэтому скачки — сигнал проверить тип данных и определение X.
Для непрерывной X `PDF` описывает, как распределена вероятность по оси значений, а `CDF` показывает, какая доля уже накопилась до x. Поэтому `P(a<X<=b)` можно получать как площадь под `PDF` на интервале или как разность значений `CDF`. Ошибка новичка — подставлять `PDF(a)` вместо `P(X=a)`, хотя для непрерывного случая `P(X=a)=0`. Для задач с порогами и процентилями обычно удобнее работать через `CDF`.
Для дискретной X отдельное значение может иметь ненулевую вероятность, поэтому `P(X=2)` берётся напрямую из `PMF`. Для непрерывной X точечная вероятность равна 0, и используют `PDF` или `CDF` для интервалов. Смешение этих понятий приводит к типичной ошибке: читать `PDF(x)` как `P(X=x)`. Поэтому всегда уточняйте, дискретная у вас X или непрерывная.
В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.
Тренировать в Telegram