Случайные величины: основы: вопросы для собеседования (часть 3)
Что такое случайная величина, дискретная vs непрерывная, PMF, PDF, CDF — базовые понятия, без которых невозможно говорить о распределениях и статистике. На собеседовании спрашивают, чем PDF отличается от PMF, как найти вероятность через CDF и что значит «распределение случайной величины».
Вопросы 11–15 из 20
11Если для `random variable` X известно, что `CDF` F(10)=0.9, что это означает?
A`P(X=10)=0.9`
B`PDF(10)=0.9`
C`P(X>10)=0.9`
D`P(X<=10)=0.9`
Ответ: Значение `CDF` в точке интерпретируется как `P(X<=x)` для соответствующего x.
Если `F(10)=0.9`, то 90% вероятности лежит слева от 10, то есть X не превышает 10 с вероятностью 0.9. Это не говорит, что X равна 10 с вероятностью 0.9, потому что точечная вероятность зависит от дискретности. Для непрерывных величин `P(X=10)=0`, а для дискретных может быть ненулевой скачок `CDF`. Поэтому важно уточнять тип X.
12Какие условия должны выполняться, чтобы функция была корректной `PMF` для дискретной `random variable` X?
AЗначения могут быть отрицательными, если сумма равна 1.
BВсе значения неотрицательны, и сумма `P(X=x)` по всем возможным x равна 1.
CИнтеграл `PDF` по всем x должен быть равен 1.
D`CDF` должна быть строго убывающей.
Ответ: Корректная `PMF` должна быть неотрицательной и суммироваться в 1.
`PMF` задаёт `P(X=x)` для дискретных значений, поэтому каждая вероятность должна быть >=0. Кроме того, сумма `P(X=x)` по всем возможным x должна равняться 1, иначе модель не описывает полный набор исходов. Это базовый `sanity-check` при чтении табличных распределений. Для непрерывных моделей аналогичная идея выражается через площадь под `PDF`, но это другой случай.
13В эксперименте с монетой определили `random variable` `Y`: `Y=1`, если выпал орёл, иначе 0. Почему такая конструкция удобна?
AПотому что делает `P(Y=1)` равной 1 всегда.
BПотому что переводит монету в непрерывную модель и позволяет использовать `PDF`.
CПотому что превращает исходы в числовую `random variable`, и тогда можно задавать `PMF`, считать `P(Y=1)` и сравнивать средние.
DПотому что убирает случайность и делает результат детерминированным.
Ответ: Индикаторная `random variable` переводит исходы в числа и позволяет напрямую задавать `PMF` и вероятности.
Когда исходы нечисловые, их неудобно агрегировать и сравнивать, но индикатор делает это возможным. Для Y можно явно задать `PMF` и работать с вероятностями вроде `P(Y=1)`. В аналитике такой приём описывает события типа покупка/не покупка и помогает связывать их с частотой и средним. Это не делает процесс непрерывным и не требует `PDF`.
14Почему для непрерывной `random variable` X верно `P(X=a)=0`, даже если значение a кажется возможным?
AПотому что вероятность связана с площадью, а точка имеет нулевую ширину интервала.
BПотому что `PDF` всегда равна 0.
CПотому что `CDF` никогда не меняется.
DПотому что X никогда не принимает значение a на практике.
Ответ: Для непрерывных распределений `P(X=a)=0`, потому что вероятность определяется для интервалов, а не для одной точки.
Непрерывная модель описывает вероятности через площадь под `PDF`. У одной точки нет длины, поэтому площадь над одной точкой равна 0, что и даёт `P(X=a)=0`. На практике обычно интересуются вероятностями интервалов, например `P(a<X<=b)` для малого диапазона вокруг a.
15Какое утверждение про `PDF` непрерывной `random variable` верно?
A`PDF` везде должна быть меньше 1, иначе `probability` станет больше 1.
BСумма значений `PDF` по всем x должна быть равна 1.
C`PDF` может быть больше 1, потому что ограничение 0..1 относится к `probability` на интервалах, а не к `PDF` в точке.
DЕсли `PDF` больше 1, то `P(X=a)=0` перестаёт быть верным.
Ответ: `PDF` может превышать 1, потому что это не `probability`, а плотность, и вероятность получается как площадь.
Вероятность на интервале — это площадь под `PDF`, поэтому важно, чтобы общая площадь была 1, а не значения в отдельных точках. При узком распределении плотность может быть высокой и превышать 1, но площадь на малом интервале остаётся корректной. Типичная ошибка — путать `PDF(x)` с `P(X=x)`, которое в непрерывном случае равно 0.
Хотите тренировать интерактивно?
В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.
Тренировать в TelegramДругие темы: Теория вероятностей