Question 1

`конверсия` выросла с 5% до 6%. Как корректно назвать абсолютное изменение?

Accepted Answer

Абсолютная разница долей измеряется в процентных пунктах. С 5% до 6% — это плюс 1 процентный пункт (абсолютная разница). Относительный рост здесь 20%, но он отвечает на другой вопрос. Типичная ошибка — путать проценты и процентные пункты в выводах по A/B тесту.

Question 2

Когда двухвыборочный `z-test` для сравнения долей обычно уместен?

Accepted Answer

`z-test` опирается на приближение нормальностью, которое лучше работает на больших выборках. В `z-test` для долей используется нормальное приближение распределения оценок. Когда `n` мало или `p` близко к 0 или 1, приближение становится грубым. Тогда `p-value` и доверительные интервалы могут быть неточными. В таких случаях лучше рассмотреть более аккуратные методы, основанные на биномиальном распределении.

Question 3

Вы считаете конверсию из визита в покупку на уровне пользователя. Что корректно считать `success` и что считать `trial` для расчёта доли?

Accepted Answer

Для доли нужен чёткий числитель `success` и знаменатель `trial` на одной единице учёта. Если метрика на уровне пользователя, то `trial` — пользователь, а `success` — факт покупки у этого пользователя. Тогда доля становится долей покупателей среди пользователей. Смешивать уровни (например, выручку и пользователей) нельзя: это уже не тест для долей, а среднее на пользователя. Типичная ошибка — менять знаменатель между группами или использовать разный уровень агрегации в числителе и знаменателе.

Question 4

Какие допущения делают биномиальную модель разумной для конверсии?

Accepted Answer

Биномиальная модель предполагает независимые испытания и одинаковую вероятность успеха в каждом из них. В биномиальной модели каждое испытание имеет одну и ту же вероятность успеха, и испытания считаются независимыми. Это хорошая абстракция для доли покупателей среди пользователей при корректной единице учёта. Если испытания зависимы (например, много событий на одного пользователя), стандартная ошибка доли будет оценена неверно. Тогда нужно менять дизайн учёта или метод оценки.

Question 5

При фиксированном `n` у какой доли стандартная ошибка доли обычно максимальна (по `p*(1-p)`)?

Accepted Answer

Величина `p*(1-p)` максимальна около `p = 0.5`, поэтому и `SE` там больше. Формула `SE = sqrt(p*(1-p)/n)` зависит от `p*(1-p)`. Эта часть максимальна при `p = 0.5` и уменьшается, когда `p` близко к 0 или 1. Поэтому при одинаковом `n` доли около 50% дают более шумные оценки. Это полезно для интуитивного планирования экспериментов по конверсии.

Вопросы по теме «Тесты для долей»

Вопросы 1–5 из 20

Хотите тренировать интерактивно?

Другие темы: Статистика