Question 1

Пользователь либо совершил покупку в сессии, либо нет (0/1). Какое распределение лучше всего описывает один такой исход — успех или неудача?

Accepted Answer

Один бинарный исход «успех/неудача» моделируют как `Bernoulli(p)` с параметром `p`. В `Bernoulli(p)` исход принимает 1 при успехе и 0 при неудаче. Параметр `p` задаёт шанс успеха в одном испытании. Если вы суммируете `n` таких исходов, то естественной моделью становится `Binomial(n,p)`, а если ждёте первого успеха — `Geometric(p)`.

Question 2

В модели `Bernoulli(p)` для клика по баннеру, что означает параметр `p`?

Accepted Answer

В `Bernoulli(p)` параметр `p` — это вероятность успеха в одном испытании. Если `p` близок к 0, клики редки, а если `p` близок к 1, клики происходят почти всегда. Важно, что `p` относится к одному испытанию, а не к числу пользователей или длительности интервала. Для подсчёта числа кликов среди `n` показов обычно используют `Binomial(n, p)`.

Question 3

Пусть число оплат за 1 минуту описывается `Poisson(λ)` с параметром `λ` для одной минуты. Какой параметр будет у распределения числа оплат за 2 минуты при той же интенсивности?

Accepted Answer

В `Poisson(λ)` параметр `λ` масштабируется с длиной интервала, поэтому для 2 минут будет `2 * λ`. Идея простая: если интенсивность постоянна, за вдвое больший интервал в среднем приходит вдвое больше событий. Поэтому `λ` для интервала 2 минуты становится `2 * λ`. Это удобно для перевода между разными интервалами наблюдения без пересборки модели. Биномиальное распределение здесь не подходит — у него фиксировано число испытаний, а не длительность интервала.

Question 4

Вы используете `Binomial(n,p)` для числа конверсий. Какое выражение соответствует среднему числу успехов?

Accepted Answer

Для `Binomial(n,p)` среднее число успехов равно `n*p`. Интуитивно, если шанс успеха равен `p`, то из `n` испытаний в среднем успешными будут примерно доля `p`. Поэтому типичное число успехов пропорционально `n` и `p`. Эта связь помогает при грубой оценке ожидаемого объёма конверсий в группе при известных значениях `n` и `p`.

Question 5

Вы мониторите, сколько ошибок типа таймаут происходит за 1 минуту. Поток примерно стационарен, ошибки — это отдельные события. Какое распределение обычно используют для числа событий за интервал?

Accepted Answer

Число событий за интервал при постоянной интенсивности описывает `Poisson(λ)`. В `Poisson(λ)` параметр `λ` — среднее число событий в выбранном интервале; модель подходит для потоков ошибок, заявок и сообщений при примерно постоянной интенсивности. Если вместо интервала зафиксировано число испытаний `n`, чаще выбирают `Binomial(n, p)`. `Geometric(p)` описывает ожидание до первого успеха, а `Bernoulli(p)` — единичное испытание.

Вопросы по теме «Дискретные распределения»

Вопросы 1–5 из 20

Хотите тренировать интерактивно?

Другие темы: Теория вероятностей