Бернулли, биномиальное, пуассоновское, геометрическое распределения — модели для подсчёта событий и успехов. На собеседовании спрашивают, когда применять каждое из них: сколько покупок в час (Пуассон), какова вероятность трёх успехов из десяти попыток (биномиальное). Конкретные примеры из бизнеса ценятся особенно.
Это значит, что количество прошлых неудачных попыток не меняет шанс успеха на следующей, если `p` постоянен. Поэтому `Geometric(p)` хорошо описывает повторяющиеся попытки одинакового качества, например повторный запрос к API. Если `p` меняется по мере попыток, то простая `Geometric(p)` перестает быть хорошей аппроксимацией.
Подробный разбор →`variance` максимальна около `p = 0.5` и уменьшается, когда `p` близок к 0 или 1. Интуитивно, когда `success` почти никогда или почти всегда, неопределенности меньше. Понимание `variance` полезно при планировании размера выборки для метрик 0/1.
Подробный разбор →Это означает, что разброс счетчика `event` растет вместе с уровнем потока. Если на данных `variance` существенно больше `mean`, это может быть сигналом неоднородной интенсивности или кластеризации `event`. Тогда для аналитики стоит задуматься о другом интервале наблюдения или иной модели.
Подробный разбор →В такой постановке интервал фиксирован, а число `event` случайно — это типичный сценарий для `Poisson(λ)`. Если бы вместо этого у вас было фиксированное `n` попыток и шанс `success` равен `p`, тогда подходил бы `Binomial(n,p)`. Важно согласовать, что фиксировано: интервал времени или `n` `trial`.
Подробный разбор →Интуитивно, много редких `success` по большим `n` дают счетчик событий, похожий на поток `event`. В такой ситуации работать с `Poisson(λ)` бывает удобнее, особенно если `n` трудно фиксировать, а `λ` стабилен для интервала. Важно помнить, что это аппроксимация, и при больших `p` она может давать заметную ошибку.
Подробный разбор →В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.
Тренировать статистику в Telegram