Question 1

В мониторинге задержек написано: 95-й перцентиль времени ответа равен 400 мс. Как это правильно интерпретировать?

Accepted Answer

`Quantile` уровня 95% — это порог, ниже которого по `cdf` лежит 95% вероятностной массы распределения. Если 95-й `quantile` равен 400 мс, это означает, что большая часть распределения лежит левее этого порога. Такое утверждение относится к накопленной вероятности по `cdf`, а не к значению плотности в точке. Важно помнить, что `quantile` не говорит, насколько велики самые худшие 5% наблюдений — он лишь задаёт порог, ниже которого находится заданная доля массы.

Question 2

В каком случае предположение `Uniform(a,b)` наиболее разумно как стартовая модель?

Accepted Answer

`Uniform(a,b)` уместно, когда известны границы и плотность внутри интервала можно считать одинаковой. Равномерная модель полезна, когда вы знаете, что величина лежит в определённом диапазоне, но нет информации о предпочтениях внутри него. Тогда постоянная плотность — простое и прозрачное допущение. В реальных задачах его часто используют как базовое приближение, а затем проверяют, нет ли пиков или смещений, через данные и квантили. Симметрия вокруг среднего, свойство отсутствия памяти и тяжёлые хвосты указывают на другие распределения.

Question 3

Как влияет увеличение параметра `λ` в распределении `Exponential(λ)` на время ожидания события?

Accepted Answer

В `Exponential(λ)` больший `λ` соответствует большей частоте событий и меньшему среднему времени ожидания. Параметр `λ` интуитивно понимается как частота событий: чем он больше, тем быстрее обычно наступает событие. Поэтому уменьшается среднее время ожидания, и больше вероятностной массы оказывается около нуля. При этом форма остаётся экспоненциальной, а свойство отсутствия памяти сохраняется.

Question 4

Команда задаёт SLA по задержке как порог, равный 95-му процентилю задержки. При стабильной системе что это означает на языке вероятностей?

Accepted Answer

Порог на уровне 95-го процентиля означает, что функция распределения в пороге равна 0.95: 95% массы вероятности ниже порога. 95-й процентиль — это значение, ниже которого лежит 95% распределения, то есть функция распределения (CDF) в пороге равна 0.95. Такой SLA говорит про долю запросов, а не про максимальное время ответа: оставшиеся 5% могут быть существенно хуже. Поэтому полезно смотреть не только один процентиль, но и другие уровни, чтобы понять хвост. Среднее и плотность — это другие характеристики, и они могут вести себя совсем не так, как процентиль.

Question 5

Два нормальных распределения имеют одинаковое среднее `μ`, но у второго стандартное отклонение `σ` больше. Как будет выглядеть второе по сравнению с первым?

Accepted Answer

Большее `σ` при том же среднем означает большую дисперсию и более широкую, но более низкую кривую плотности. При фиксированном среднем параметр `σ` отвечает за разброс: чем он больше, тем больше типичные отклонения от центра. Это увеличивает дисперсию и делает график плотности более распластанным, потому что общая площадь под кривой должна оставаться равной 1. В аналитике это означает большую неопределённость и более широкий диапазон значений квантилей. Среднее при этом не сдвигается, а плотность остаётся непрерывной.

Непрерывные распределения: вопросы для собеседования (часть 3)

Вопросы 11–15 из 20

Хотите тренировать интерактивно?

Другие темы: Теория вероятностей