Question 1

Ошибка измерения датчиком обычно симметрична вокруг нуля и складывается из многих мелких независимых факторов. Какая модель чаще всего подходит для такой ошибки?

Accepted Answer

Сумма многих малых независимых влияний часто даёт форму, близкую к `Normal(μ, σ)`. Когда ошибка получается как результат множества небольших шумов, разумно ожидать примерно симметричную форму вокруг центра. Тогда `Normal(μ, σ)` становится удобной моделью для описания неопределённости измерения. Параметр `σ` задаёт типичный масштаб отклонений и связан с дисперсией. Это следствие центральной предельной теоремы для сумм независимых вкладов.

Question 2

В модели ошибки измерения вы используете `Normal(μ,σ)`. Как правильно интерпретировать параметры `μ` и `σ`?

Accepted Answer

В `Normal(μ,σ)` `μ` соответствует среднему, а `σ` контролирует разброс и связан с дисперсией. Параметр `μ` задаёт, вокруг какого значения концентрируются наблюдения, то есть центр распределения по среднему. Параметр `σ` определяет, насколько широким будет распределение, и напрямую связан с дисперсией `σ²`. Для аналитики важно помнить: изменение `μ` сдвигает распределение, а изменение `σ` меняет неопределённость и ширину. Варианты про минимум/максимум и про квантиль с плотностью путают параметры с другими характеристиками распределения.

Question 3

Вы моделируете время до следующей покупки пользователя, если покупки происходят с примерно постоянной интенсивностью и без заметной сезонности в коротком окне. Какая модель распределения чаще всего подходит как первое приближение?

Accepted Answer

Время до события при постоянной интенсивности часто моделируют как `Exponential(λ)`. `Exponential(λ)` часто используют как модель времени ожидания между событиями при условии постоянной интенсивности. Параметр `λ` связан с тем, насколько часто происходят события, и определяет типичный масштаб ожидания через среднее. На практике это удобная базовая модель, которую потом можно уточнять, если видны пики, сезонность или разные режимы поведения пользователей.

Question 4

На графике плотности для нормального распределения `Normal(μ,σ)` вы увидели, что максимум плотности больше 1. Что это означает?

Accepted Answer

Значение плотности может быть больше 1, потому что ограничение 0..1 относится к вероятности, а не к плотности. Плотность измеряется в обратных единицах (например, 1/секунда), поэтому по величине может быть больше 1. Корректная вероятность получается только после интегрирования — как площадь под кривой плотности на интервале. Из-за этого нельзя интерпретировать значение плотности как вероятность события само по себе. Вариант про «вероятность больше 1» путает плотность и вероятность; отрицательная дисперсия невозможна по определению; а нормальное распределение непрерывно, значит вероятностной массы в точке у него нет.

Question 5

В продуктовой аналитике время ответа эндпойнта иногда моделируют как `Normal(μ,σ)`. Что корректно сказать про вероятность того, что время ответа будет ровно 200 мс?

Accepted Answer

Для непрерывных моделей `probability` ровно в одной точке равна 0, а `density` сама по себе не является вероятностью. В непрерывных моделях вероятность связана с площадью под графиком плотности на интервале. Поэтому для значения ровно 200 мс вероятность равна 0, даже если плотность в этой точке высокая. На практике сравнивают интервалы (например, меньше порога) и часто используют функцию распределения `cdf` или квантили для интерпретации хвостов.

Вопросы по теме «Непрерывные распределения»

Вопросы 1–5 из 20

Хотите тренировать интерактивно?

Другие темы: Теория вероятностей