Вопросы по теме «Дискретные распределения»

Бернулли, биномиальное, пуассоновское, геометрическое распределения — модели для подсчёта событий и успехов. На собеседовании спрашивают, когда применять каждое из них: сколько покупок в час (Пуассон), какова вероятность трёх успехов из десяти попыток (биномиальное). Конкретные примеры из бизнеса ценятся особенно.

Всего в этом разделе 20 вопросов. Каждый — с правильным ответом и кратким разбором теории. Разбито на 4 части по 5 вопросов.

Теорема БайесаУсловная вероятностьНепрерывные распределенияКомбинаторикаМатематическое ожидание и дисперсияНезависимость событийСовместные распределения и ЦПТСлучайные величины: основыМножества и события

Вопросы 15 из 20

1Пользователь либо совершил покупку в сессии, либо нет (0/1). Какое распределение лучше всего описывает один такой `trial` с исходом `success` или `failure`?
A`Bernoulli(p)`
B`Binomial(n,p)`
C`Geometric(p)`
D`Poisson(λ)`
Ответ: Один бинарный `trial` с `success` или `failure` моделируют как `Bernoulli(p)` с параметром `p`.

В `Bernoulli(p)` исход принимает 1 при `success` и 0 при `failure`. Параметр `p` задает шанс `success` в одном `trial`. Если вы суммируете `n` таких исходов, то естественной моделью становится `Binomial(n,p)`.

2В модели `Bernoulli(p)` для клика по баннеру, что означает параметр `p`?
A`p` — число пользователей в `population`
B`p` — шанс `success` (клика) в одном `trial`
C`p` — среднее число `event` за интервал
D`p` — число `success` среди `n` `trial`
Ответ: В `Bernoulli(p)` параметр `p` — шанс `success` в одном `trial`.

Если `p` близок к 0, клики редки, а если `p` близок к 1, клики происходят почти всегда. Важно, что `p` относится к одному `trial`, а не к числу пользователей или длительности интервала. Для подсчета числа кликов среди `n` показов обычно используют `Binomial(n,p)`.

3Пусть число оплат за 1 минуту описывается `Poisson(λ)` с параметром `λ` для одной минуты. Какой параметр будет у распределения числа оплат за 2 минуты при той же интенсивности?
A`λ`
B`2*λ`
C`λ/2`
D`Binomial(n,p)`
Ответ: В `Poisson(λ)` параметр `λ` масштабируется с длиной интервала, поэтому для 2 минут будет `2*λ`.

Интуиция простая: если интенсивность постоянна, за вдвое больший интервал приходит примерно вдвое больше `event`. Поэтому `λ` для интервала 2 минуты становится `2*λ`. Это удобно для перевода между разными интервалами наблюдения без пересборки модели.

4Вы используете `Binomial(n,p)` для числа конверсий. Какое выражение соответствует `mean` числа `success`?
A`p`
B`λ`
C`n*p`
D`n/p`
Ответ: Для `Binomial(n,p)` `mean` числа `success` равна `n*p`.

Интуитивно, если шанс `success` равен `p`, то из `n` `trial` в среднем успешными будут примерно доля `p`. Поэтому типичное число успехов пропорционально `n` и `p`. Эта связь помогает при грубой оценке ожидаемого объема конверсий в группе.

5Вы мониторите, сколько ошибок типа `timeout` происходит за 1 минуту. Предположим, что поток примерно стационарен, а ошибки — это `event`. Какое распределение обычно используют для числа `event` за интервал?
A`Binomial(n,p)`
B`Geometric(p)`
C`Poisson(λ)`
D`Bernoulli(p)`
Ответ: Число `event` за интервал при постоянной интенсивности описывает `Poisson(λ)`.

В `Poisson(λ)` параметр `λ` — среднее число `event` в выбранном интервале. Модель подходит для потоков: ошибки, входящие заявки, сообщения, если интенсивность примерно постоянна внутри интервала. Если вместо интервала у вас фиксировано `n` `trial`, чаще выбирают `Binomial(n,p)`.

1234

Хотите тренировать интерактивно?

В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.

Тренировать в Telegram

Другие темы: Теория вероятностей

Теорема БайесаУсловная вероятностьНепрерывные распределенияКомбинаторикаМатематическое ожидание и дисперсияНезависимость событийСовместные распределения и ЦПТСлучайные величины: основыМножества и события