Question 1

Сервис моделирует время до следующего входящего запроса как `Exponential(λ)`. Вы уже не видели запросов 1 минуту. Какое утверждение про `conditional probability` увидеть следующий запрос позже, чем через ещё 30 секунд соответствует свойству `memoryless` (свойство «без памяти»)?

Accepted Answer

`Exponential(λ)` обладает свойством `memoryless` (свойство «без памяти»), поэтому условное распределение остатка не зависит от прошедшего времени. Если модель `Exponential(λ)` применима, то знание, что вы уже ждали 1 минуту, не меняет `probability` ждать ещё 30 секунд. Это свойство удобно в задачах про время до события, но важно проверять применимость предположения о постоянном `rate`. Если `rate` меняется со временем, `memoryless` (свойство «без памяти») обычно нарушается, и модель нужно пересмотреть.

Question 2

Время ожидания ответа оператора моделируется как `Exponential(λ)`. Клиент уже ждёт 3 минуты. Что верно про условную вероятность ждать ещё больше 2 минут?

Accepted Answer

`Exponential(λ)` обладает свойством `memoryless` (без памяти), поэтому условная вероятность зависит только от будущего интервала. Свойство `memoryless` (без памяти) означает, что уже прошедшее время ожидания не меняет распределение оставшегося времени. Поэтому условная вероятность ждать ещё больше 2 минут совпадает с вероятностью ждать больше 2 минут с самого начала. Это не означает, что среднее ожидание маленькое или большое само по себе: масштаб задаётся `λ` через среднее `1/λ`. Варианты про плотность и независимость от `λ` путают определения вероятности и плотности.

Question 3

Какая пара утверждений про `cdf` и `density` наиболее корректна?

Accepted Answer

`cdf` даёт накопленную вероятность, а `density` — локальную «интенсивность» и сама по себе не равна вероятности. `cdf` удобно интерпретировать как долю вероятностной массы слева от порога, поэтому через неё легко получать квантили. `density` показывает, где масса распределения сконцентрирована, но её нужно интегрировать, чтобы получить вероятность на интервале. Из-за этого сравнение `density` в точках не заменяет сравнение вероятностей для диапазонов: значение плотности может быть больше 1 для непрерывных величин и не является вероятностью.

Question 4

На графике плотности распределения видно, что около значения t плотность почти постоянна на маленьком интервале. Как корректно приблизить вероятность попасть в этот маленький интервал?

Accepted Answer

Для малого интервала вероятность можно оценить как площадь, то есть значение плотности умножить на ширину интервала. Интуиция такая же, как у площади прямоугольника: высота — это плотность, ширина — длина интервала, произведение даёт приближение площади. Это работает, когда плотность мало меняется внутри интервала. При больших интервалах нужно учитывать изменение плотности и считать точнее через функцию распределения или численное интегрирование. Важно помнить: значение плотности в точке не равно вероятности попасть ровно в эту точку.

Question 5

Два времени выполнения запроса моделируются как `Normal(μ,σ)` с одинаковым `μ`, но в системе B `σ` больше. В какой системе больше вероятность увидеть очень большие отклонения от среднего значения `μ`?

Accepted Answer

При фиксированном `μ` больший `σ` означает большую дисперсию и выше вероятность больших отклонений. У `Normal(μ,σ)` увеличение `σ` делает распределение шире: больше массы уходит в хвосты. Это означает более высокую вероятность увидеть значения далеко от среднего значения `μ`, даже если центр распределения один и тот же. В продуктовых метриках это часто проявляется как больше редких, но очень больших задержек, что напрямую влияет на верхние квантили. Утверждения про равенство при одинаковом среднем или про неопределённость плотности игнорируют, что именно `σ` управляет шириной распределения.

Непрерывные распределения: вопросы для собеседования (часть 4)

Вопросы 16–20 из 20

Хотите тренировать интерактивно?

Другие темы: Теория вероятностей