Дискретные распределения: вопросы для собеседования (часть 3)

Бернулли, биномиальное, пуассоновское, геометрическое распределения — модели для подсчёта событий и успехов. На собеседовании спрашивают, когда применять каждое из них: сколько покупок в час (Пуассон), какова вероятность трёх успехов из десяти попыток (биномиальное). Конкретные примеры из бизнеса ценятся особенно.

Теорема БайесаУсловная вероятностьНепрерывные распределенияКомбинаторикаМатематическое ожидание и дисперсияНезависимость событийСовместные распределения и ЦПТСлучайные величины: основыМножества и события

Вопросы 1115 из 20

11За день система обработала ровно `n` загрузок файла; каждая загрузка — `trial` и может завершиться `success` с шансом `p`. Какое распределение описывает число успешных загрузок за день?
A`Poisson(λ)`
B`Binomial(n,p)`
C`Bernoulli(p)`
D`Geometric(p)`
Ответ: Число `success` в фиксированных `n` `trial` описывает `Binomial(n,p)`.

Здесь `n` — заранее известное число попыток, а `p` — шанс успеха каждой. Случайная величина — сколько `success` получилось среди `n`. Если `n` само сильно меняется и вы считаете `event` по интервалам, возможно, лучше `Poisson(λ)`.

12Каждый день у пользователя есть шанс `p` совершить первую покупку, дни считаем как последовательные `trial` до первого `success`. Какое распределение подходит для числа дней до первой покупки?
A`Binomial(n,p)`
B`Geometric(p)`
C`Poisson(λ)`
D`Bernoulli(p)`
Ответ: Число `trial` до первого `success` при постоянном `p` описывает `Geometric(p)`.

Здесь каждый день — один `trial` с исходом `success` или `failure`. Случайная величина — сколько дней пройдет до первой покупки. Если вместо этого вы фиксируете `n` дней и считаете, сколько покупок было в эти `n` дни, это уже ближе к `Binomial(n,p)` для количества `success`.

13Какая постановка наиболее прямо соответствует `Poisson(λ)`?
AСколько `success` будет среди фиксированных `n` `trial` с шансом `p`
BИсход одного `trial`, где бывает `success` или `failure`
CСколько `trial` нужно до первого `success` при шансе `p`
DСколько `event` произойдет за фиксированный интервал при средней интенсивности `λ`
Ответ: `Poisson(λ)` используют для числа `event` за фиксированный интервал при постоянной интенсивности `λ`.

В `Poisson(λ)` ключевое — фиксирован интервал, а число `event` в нём случайно. Это подходит для потоков: заявки, ошибки, сообщения, если интенсивность примерно постоянна в выбранном интервале. Если вместо интервала фиксировано число `trial` `n`, то для количества `success` обычно выбирают `Binomial(n,p)`.

14Какой вариант лучше всего объясняет отличие `Geometric(p)` от `Binomial(n,p)` в контексте retry-процесса?
A`Geometric(p)` описывает число `event` за интервал, а `Binomial(n,p)` — число `trial` до `success`
B`Geometric(p)` использует параметр `λ`, а `Binomial(n,p)` использует параметр `p`
C`Geometric(p)` всегда принимает значения только 0 или 1, а `Binomial(n,p)` — любые числа
D`Geometric(p)` считает число `trial` до первого `success`, а `Binomial(n,p)` считает число `success` при фиксированном `n`
Ответ: В `Geometric(p)` фиксирован `p` и считается число `trial` до первого `success`, а в `Binomial(n,p)` фиксирован `n` и считается число `success`.

Если вы спрашиваете, сколько попыток нужно до первого успеха, интересует длина процесса, поэтому логична `Geometric(p)`. Если вы спрашиваете, сколько успехов будет в ровно `n` попытках, то это `Binomial(n,p)`. Оба распределения используют `p`, но случайная величина и постановка задачи разные.

15Вы храните для каждого пользователя бинарную метку покупки: 1 если купил, 0 если нет, это один `trial` на пользователя. Какое утверждение про модели верно?
AОдна метка — это `Poisson(λ)`, а сумма по пользователям — `Geometric(p)`
BОдна метка — это `Binomial(n,p)`, а сумма по пользователям — `Bernoulli(p)`
CОдна метка — это `Bernoulli(p)`, а сумма по `n` пользователям — `Binomial(n,p)`
DОдна метка — это `Geometric(p)`, а сумма по пользователям — `Poisson(λ)`
Ответ: Один бинарный исход — `Bernoulli(p)`, а сумма по `n` таким исходам — `Binomial(n,p)`.

Когда вы смотрите на одного пользователя, исход покупки можно рассматривать как `Bernoulli(p)`. Если вы берете `n` пользователей и считаете, сколько из них купили, вы получаете число `success` в `n` `trial`. Это и есть постановка `Binomial(n,p)`, если шанс покупки `p` одинаков для всех `trial`.

1234

Хотите тренировать интерактивно?

В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.

Тренировать в Telegram

Другие темы: Теория вероятностей

Теорема БайесаУсловная вероятностьНепрерывные распределенияКомбинаторикаМатематическое ожидание и дисперсияНезависимость событийСовместные распределения и ЦПТСлучайные величины: основыМножества и события