Question 1

Что верно для равномерного распределения `Uniform(a, b)`?

Accepted Answer

У равномерного `Uniform(a, b)` плотность постоянна, поэтому функция распределения и квантиль меняются линейно на интервале. Равномерная модель означает отсутствие предпочтительных значений внутри диапазона, поэтому плотность одинакова для всех точек интервала. Из-за этого функция распределения растёт равномерно, и квантиль легко интерпретируется как пропорциональная позиция внутри интервала. При этом, как и у любой непрерывной модели, вероятность ровно в точке равна нулю — поэтому варианты с «ростом плотности к `b`» или «вероятностью в точке `a` больше нуля» неверны.

Question 2

Вы моделируете время до следующего отказа сервиса. Риск отказа в каждый момент примерно постоянный, и прошлое время без отказов не меняет будущее (свойство «без памяти»). Какую модель выбрать?

Accepted Answer

Постоянная интенсивность и свойство «без памяти» естественно ведут к модели `Exponential(λ)`. Экспоненциальное распределение `Exponential(λ)` используют, когда событие может произойти в любой момент с примерно постоянной интенсивностью, а прошлое не влияет на будущее. Параметр `λ` задаёт частоту событий, а среднее время ожидания равно `1/λ`. Равномерное распределение ограничено отрезком и не подходит для моделирования времени до редких событий. Нормальное симметрично и допускает отрицательные значения, что бессмысленно для времени. Если по данным видно, что риск растёт или падает со временем, предпосылка постоянной интенсивности нарушается, и модель стоит пересматривать.

Question 3

Вам нужно быстро смоделировать момент времени, когда пользователь случайно открывает приложение в пределах фиксированного окна 10 минут, и нет данных о пиках внутри окна. Какое распределение выглядит разумным первым приближением?

Accepted Answer

Если внутри короткого интервала нет причин предпочитать какие-то моменты, равномерное распределение — удобная стартовая модель. Равномерная модель означает постоянную плотность по времени внутри окна и отсутствие выделенных участков. Это хорошее допущение, когда данных мало и вы хотите избежать лишних гипотез о форме распределения. Когда появятся наблюдения, можно проверять, не смещается ли квантиль или не появляется ли форма ближе к `Normal(μ, σ)`. `Exponential(λ)` и `Poisson(λ)` отвечают на другие вопросы: время до события и число событий за интервал.

Question 4

Если `X` имеет распределение `Normal(μ,σ)`, чему равна вероятность того, что `X` ровно равен своему медианному значению (50-й квантиль)?

Accepted Answer

Для непрерывных распределений вероятность попасть в одну точку равна нулю, даже если эта точка является квантилем. Медианный квантиль говорит про разделение вероятностной массы слева и справа, но не делает точечную вероятность ненулевой. В непрерывных моделях ненулевая вероятность появляется только на интервале значений. Поэтому корректно говорить о вероятности быть меньше порога или попасть в диапазон, а не о вероятности ровно одного значения.

Question 5

Для непрерывной модели с плотностью как получить вероятность того, что значение лежит между `a` и `b`?

Accepted Answer

Вероятность на интервале — это площадь под плотностью или разность `CDF`, а не значение плотности в точке. В непрерывных распределениях вероятность всегда относится к диапазону значений, а не к одному значению — для любой точки `P(X=a)=0`. Поэтому правильный способ получить вероятность для интервала — вычислить площадь под плотностью на этом интервале. Практически это часто делают через `CDF`, потому что разность `CDF(b) - CDF(a)` сразу даёт вероятность попадания в диапазон. Сравнение или сложение плотностей в точках не имеет вероятностного смысла.

Непрерывные распределения: вопросы для собеседования (часть 2)

Вопросы 6–10 из 20

Хотите тренировать интерактивно?

Другие темы: Теория вероятностей