Экспоненциальное распределение простыми словами

Карьерник — квиз-тренажёр в Telegram с 1500+ вопросами для собесов аналитика. SQL, Python, A/B, метрики. Бесплатно.

Зачем это знать

Время до churn пользователя, время между заказами, response time API — все описываются exponential distribution. Это непрерывный аналог Poisson — если Poisson считает «сколько событий», exponential говорит «через сколько времени».

На собесах middle+ и в survival analysis exponential — базовый строительный блок. Без него — нет hazard rate, нет Cox regression.

Короткое объяснение

Exponential(λ) описывает время до первого события в Poisson-процессе со скоростью λ.

Примеры:

  • Время до прихода следующего клиента
  • Время жизни lightbulb
  • Interval between покупок

Формула

PDF (плотность):

f(x) = λ × e^(-λ × x),  x ≥ 0

CDF:

F(x) = 1 - e^(-λ × x)

Вероятность, что событие случится до момента x.

Характеристики

  • Среднее: 1 / λ
  • Дисперсия: 1 / λ²
  • Median: ln(2) / λ ≈ 0.693 / λ

Пример в аналитике

В среднем клиенты приходят каждые 2 минуты → λ = 1/2 = 0.5 клиента в минуту.

Время до следующего клиента — Exp(0.5).

Mean = 2 минуты (как ожидалось).

Memoryless property

Уникальное свойство: прошлое не влияет на будущее.

P(X > t + s | X > s) = P(X > t)

Если lightbulb живёт в среднем 100 часов (Exp) и проработал уже 50 часов — оставшееся ожидаемое время жизни всё ещё 100 часов.

Это сильное допущение, часто нереалистичное (деградация существует).

В Python

from scipy.stats import expon
import numpy as np

# λ = 1/mean = 1/2
samples = expon.rvs(scale=2, size=1000)

# Вероятность x < 3
expon.cdf(3, scale=2)  # ≈ 0.777

Связь с Poisson

  • Poisson(λ) — сколько событий за интервал
  • Exponential(λ) — время до первого события
Если N событий в час распределены как Poisson(λ),
то время между ними — Exponential(λ).

Использование

Survival analysis

Время до churn:

S(t) = e^(-λ × t)

Вероятность дожить до момента t. Exponential — самая простая survival function.

Queueing theory

Время ожидания в очереди часто exponential.

Reliability

Время до отказа компонента.

Web latency

Response time часто имеет exponential-like хвост.

Hazard rate

Для exponential — constant hazard:

h(t) = λ  (не зависит от t)

Это memoryless property: вероятность «сломаться» одинакова в любой момент.

В Cox regression — обобщение на другие hazard shapes.

Оценка параметра

MLE для λ по data:

λ̂ = 1 / mean(data)

Просто.

В A/B-тестах

Время до конверсии — часто exponential. Для таких метрик:

  • Mean test дискутируемый (outliers сильно влияют)
  • Лучше survival analysis или log-rank test

Частые ошибки

Применять к негативным значениям

Exponential — только для x ≥ 0.

Игнорировать memoryless

Если данные имеют «возраст» (lightbulbs деградируют) — exponential не подходит. Используйте Weibull.

Confuse exp и log-normal

Оба имеют тяжёлый хвост, но разные формы. Log-normal — не memoryless.

На собесе

«Что описывает exponential?» Время до события в Poisson-процессе.

«Memoryless что это?» Прошлое не влияет на будущее. Единственное непрерывное с этим свойством.

«Связь с Poisson?» Poisson — count, exponential — intervals.

«Mean и variance?» 1/λ и 1/λ².

Связанные темы

FAQ

Всегда λ > 0?

Да. Иначе распределение не существует.

Альтернативы для time-to-event?

Weibull (гибче), log-normal, gamma.

Где встречается?

Queueing, reliability, survival, latency.


Тренируйте статистику — откройте тренажёр с 1500+ вопросами для собесов.