CDF F(x) для random variable X. Как выразить P(X>t) через F?Что такое случайная величина, дискретная vs непрерывная, PMF, PDF, CDF — базовые понятия, без которых невозможно говорить о распределениях и статистике. На собеседовании спрашивают, чем PDF отличается от PMF, как найти вероятность через CDF и что значит «распределение случайной величины».
Всего в этом разделе 20 вопросов. Каждый — с правильным ответом и кратким разбором теории. Разбито на 4 части по 5 вопросов.
X может принимать только отдельные значения, поэтому имеет смысл говорить о вероятностях вроде `P(X=6)`. Для дискретного случая удобно использовать `PMF` и понимать, что `CDF` будет ступенчатой. Непрерывные модели обычно применяют к величинам вроде времени ожидания или измерений, где значения меняются плавно.
Подробный разбор →`CDF` всегда не убывает и лежит между 0 и 1. Она удобна тем, что вероятность интервала можно получить разностью `CDF`, например `P(a<X<=b)=F(b)-F(a)`. Для дискретных величин `CDF` имеет скачки, а для непрерывных обычно изменяется плавно.
Подробный разбор →Сначала есть набор исходов (например, орёл/решка), а `random variable` превращает их в числа. Благодаря этому можно задавать вероятности вроде `P(X=1)` и делать вычисления, даже если исходы не числовые. Конкретное кодирование (1 и 0) выбирают для удобства, но оно сохраняет смысл вероятностной модели.
Подробный разбор →Время может принимать много значений, поэтому точечные вероятности вроде `P(X=t)` в непрерывной модели равны 0. `PMF` подходит, когда есть счётное множество значений (например, число покупок). Для задержек удобно использовать `PDF` или `CDF` и работать с вероятностями интервалов, например `P(X<=500)`.
Подробный разбор →`PMF` можно воспринимать как таблицу: каждому возможному x соответствует `P(X=x)`. Вероятность события вроде `P(X>=2)` находится суммированием соответствующих значений `PMF`. `CDF` для дискретного случая строится как накопленная сумма `PMF` и выглядит как ступенчатая функция.
Подробный разбор →В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.
Тренировать статистику в Telegram