Вопросы по теме «Непрерывные распределения»

Нормальное, экспоненциальное, равномерное распределения — основа статистического моделирования. На собеседовании просят нарисовать плотность, посчитать вероятность попадания в интервал, объяснить правило трёх сигм. Знание свойств основных распределений необходимо для понимания статистических тестов.

Всего в этом разделе 20 вопросов. Каждый — с правильным ответом и кратким разбором теории. Разбито на 4 части по 5 вопросов.

Теорема БайесаУсловная вероятностьКомбинаторикаДискретные распределенияМатематическое ожидание и дисперсияНезависимость событийСовместные распределения и ЦПТСлучайные величины: основыМножества и события

Вопросы 15 из 20

1Ошибка измерения датчиком обычно симметрична вокруг нуля и складывается из многих мелких факторов. Какая модель чаще всего подходит для такой ошибки?
A`Uniform(a,b)`
B`Exponential(λ)`
C`Normal(μ,σ)` с `μ` близким к нулю
DНикакая, потому что `density` для ошибок не используют.
Ответ: Сумма многих малых независимых влияний часто даёт форму, близкую к `Normal(μ,σ)`.

Когда ошибка получается как результат множества небольших шумов, разумно ожидать примерно симметричную форму вокруг центра `μ`. Тогда `Normal(μ,σ)` становится удобной моделью для описания неопределённости. Параметр `σ` задаёт типичный масштаб отклонений и связан с `variance`.

2В модели ошибки измерения вы используете `Normal(μ,σ)`. Как правильно интерпретировать параметры `μ` и `σ`?
A`μ` задаёт разброс, а `σ` задаёт центр.
B`μ` — минимальное значение, `σ` — максимальное значение.
C`μ` — это `quantile`, а `σ` — это `density`.
D`μ` задаёт центр (`mean`), а `σ` — масштаб разброса, связанный с `variance`.
Ответ: В `Normal(μ,σ)` `μ` соответствует `mean`, а `σ` контролирует разброс и связан с `variance`.

Параметр `μ` задаёт, вокруг какого значения концентрируются наблюдения, то есть центр распределения по `mean`. Параметр `σ` определяет, насколько широким будет распределение, и напрямую связан с `variance`. Для аналитики важно помнить: изменение `μ` сдвигает распределение, а изменение `σ` меняет неопределённость и ширину.

3Вы моделируете время до следующей покупки пользователя, если покупки происходят с примерно постоянным `rate` и без заметной сезонности в коротком окне. Какая модель распределения чаще всего подходит как первое приближение?
A`Uniform(a,b)`
B`Normal(μ,σ)`
C`Exponential(λ)`
DНикакая: время ожидания нельзя описывать через `density`.
Ответ: Время до события при постоянном `rate` часто моделируют как `Exponential(λ)`.

`Exponential(λ)` часто используют как модель времени ожидания между событиями при условии постоянной интенсивности. Параметр `λ` связан с тем, насколько часто происходят события, и определяет типичный масштаб ожидания через `mean`. На практике это удобная базовая модель, которую потом можно уточнять, если видны пики, сезонность или разные режимы поведения.

4На графике `density` для `Normal(μ,σ)` вы увидели, что максимум `density` больше 1. Что это означает?
AЭто значит, что `probability` в этой точке больше 1.
BЭто нормально: `density` может быть больше 1, а `probability` на интервале — это `area` под `density`.
CЭто значит, что `variance` стала отрицательной.
DЭто значит, что модель дискретная и нужно считать `probability mass`.
Ответ: Значение `density` может быть больше 1, потому что ограничение 0..1 относится к `probability`, а не к `density`.

`Density` измеряется в обратных `units` (например, 1/секунда), поэтому по величине может быть больше 1. Корректная `probability` получается только после интегрирования, то есть как `area` под `density` на интервале. Из-за этого нельзя интерпретировать значение `density` как вероятность события само по себе.

5В продуктовой аналитике время ответа эндпойнта иногда моделируют как `Normal(μ,σ)`. Что корректно сказать про `probability` того, что время ответа будет ровно 200 мс?
A`probability` ровно одного значения для непрерывной модели равна 0, а смысл имеет `probability` попадания в интервал.
BЭта `probability` равна значению `density` в точке 200 мс.
CЭта `probability` равна `mean`, поделённому на `variance`.
DЭта `probability` зависит только от `μ` и не зависит от `σ`.
Ответ: Для непрерывных моделей `probability` ровно в одной точке равна 0, а `density` сама по себе не является вероятностью.

В непрерывных моделях `probability` связана с площадью: `probability` попасть в диапазон равна `area` под `density` на этом диапазоне. Поэтому для значения ровно 200 мс `probability` равна 0, даже если `density` в этой точке высокая. На практике сравнивают интервалы (например, меньше порога) и часто используют `quantile` или `cdf` для интерпретации хвостов.

1234

Хотите тренировать интерактивно?

В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.

Тренировать в Telegram

Другие темы: Теория вероятностей

Теорема БайесаУсловная вероятностьКомбинаторикаДискретные распределенияМатематическое ожидание и дисперсияНезависимость событийСовместные распределения и ЦПТСлучайные величины: основыМножества и события