Question 1

За день система обработала ровно `n` загрузок файла; каждая загрузка — независимое испытание и может завершиться успехом с вероятностью `p`. Какое распределение описывает число успешных загрузок за день?

Accepted Answer

Число успехов в фиксированных `n` независимых испытаниях с вероятностью `p` описывает `Binomial(n,p)`. Здесь `n` — заранее известное число попыток, а `p` — шанс успеха каждой. Случайная величина — сколько успехов получилось среди `n` независимых испытаний, и это ровно определение биномиального распределения `Binomial(n,p)`. `Bernoulli(p)` описывает одну попытку, `Geometric(p)` — число попыток до первого успеха, а `Poisson(λ)` уместен, когда `n` не фиксировано и считается поток событий за интервал.

Question 2

Каждый день у пользователя есть шанс `p` совершить первую покупку, дни считаем как последовательные испытания до первой удачной. Какое распределение подходит для числа дней до первой покупки?

Accepted Answer

Число испытаний до первого успеха при постоянной вероятности `p` описывает геометрическое распределение `Geometric(p)`. Каждый день — одно испытание с двумя исходами: покупка или нет. Случайная величина «номер дня, в который случилась первая покупка» при постоянной вероятности `p` подчиняется геометрическому распределению `Geometric(p)`. Биномиальное распределение подошло бы, если бы вы фиксировали `n` дней и считали число покупок. Пуассоновское описывает число событий за интервал, а бернуллиевское — исход одного испытания, без учёта последовательности.

Question 3

Какая постановка наиболее прямо соответствует `Poisson(λ)`?

Accepted Answer

`Poisson(λ)` используют для числа событий за фиксированный интервал при постоянной интенсивности `λ`. В `Poisson(λ)` ключевое — фиксирован интервал, а число событий в нём случайно. Это подходит для потоков: заявки, ошибки, сообщения, если интенсивность примерно постоянна на выбранном интервале. Если фиксировано число испытаний `n`, для количества успехов обычно выбирают `Binomial(n, p)`. Геометрическое распределение описывает число испытаний до первого успеха, а распределение Бернулли — исход одного испытания.

Question 4

Какой вариант лучше всего объясняет отличие `Geometric(p)` от `Binomial(n,p)` в контексте процесса повторных попыток?

Accepted Answer

В `Geometric(p)` фиксирован `p` и считается число попыток до первого успеха, а в `Binomial(n,p)` фиксирован `n` и считается число успехов. Если вы спрашиваете, сколько попыток нужно до первого успеха, интересует длина процесса, поэтому логична `Geometric(p)`. Если вы спрашиваете, сколько успехов будет ровно в `n` попытках, то это `Binomial(n,p)`. Оба распределения используют параметр вероятности `p`, но случайная величина и постановка задачи разные. Варианты с интервалом времени или с диапазоном 0/1 путают `Geometric` с пуассоновским и бернуллиевым распределениями.

Question 5

Вы храните для каждого пользователя бинарную метку покупки: 1 если купил, 0 если нет, это одно испытание на пользователя. Какое утверждение про модели верно?

Accepted Answer

Один бинарный исход — `Bernoulli(p)`, а сумма по `n` таким исходам — `Binomial(n,p)`. Когда вы смотрите на одного пользователя, исход покупки можно рассматривать как `Bernoulli(p)`. Если вы берёте `n` пользователей и считаете, сколько из них купили, вы получаете число успехов в `n` независимых испытаниях. Это и есть постановка `Binomial(n,p)` при условии, что вероятность покупки `p` одинакова для всех пользователей. `Poisson(λ)` описывает число событий за интервал, а `Geometric(p)` — число попыток до первого успеха.

Дискретные распределения: вопросы для собеседования (часть 3)

Вопросы 11–15 из 20

Хотите тренировать интерактивно?

Другие темы: Теория вероятностей