Вопросы по теме «Тесты для долей»

z-тест для пропорций, точный тест Фишера, сравнение конверсий — задачи, которые аналитик решает постоянно. На собеседовании дают две группы с разной конверсией и просят определить, значимо ли различие. Важно знать, когда нормальное приближение работает, а когда нужен точный тест.

Всего в этом разделе 20 вопросов. Каждый — с правильным ответом и кратким разбором теории. Разбито на 4 части по 5 вопросов.

Хи-квадрат и таблицы сопряжённостиДоверительные интервалыКорреляция и регрессияОписательная статистикаОсновы проверки гипотезМножественные сравненияТочечные оценки и MLEСлучайные величины и выборочные распределенияБутстреп и перестановочные тестыВыборка и смещениеТесты для средних

Вопросы 15 из 20

1`конверсия` выросла с 5% до 6%. Как корректно назвать абсолютное изменение?
AРост на 1% (относительно)
BРост на 1 процентный пункт
CРост на 20 процентных пунктов
DРост на 0.2 процентного пункта
Ответ: Абсолютная разница долей измеряется в процентных пунктах.

С 5% до 6% — это плюс 1 процентный пункт (абсолютная разница). Относительный рост здесь 20%, но он отвечает на другой вопрос. Типичная ошибка — путать проценты и процентные пункты в выводах по A/B тесту.

2Когда двухвыборочный `z-test` для сравнения долей обычно уместен?
AВсегда, даже если в группе 10 пользователей
BТолько когда `конверсия` равна 50%
CТолько для непрерывных метрик, а не для долей
DКогда выборки достаточно большие и приближение нормальностью разумно, например `n*p` и `n*(1-p)` не слишком малы
Ответ: `z-test` опирается на приближение нормальностью, которое лучше работает на больших выборках.

В `z-test` для долей используется нормальное приближение распределения оценок. Когда `n` мало или `p` близко к 0 или 1, приближение становится грубым. Тогда `p-value` и интервалы могут быть неточными. В таких случаях лучше рассмотреть более аккуратные методы, основанные на `binomial`.

3Вы считаете конверсию из визита в покупку на уровне пользователя. Что корректно считать `success` и что считать `trial` для расчёта доли?
A`success` — пользователь совершил покупку, `trial` — пользователь в выборке; `доля = buyers/users`
B`success` — показ страницы, `trial` — покупка; `доля = views/purchases`
C`success` — сессия, `trial` — день; `доля = sessions/days`
D`success` — выручка, `trial` — пользователь; `доля = revenue/users`
Ответ: Для доли нужен четкий числитель `success` и знаменатель `trial` на одной единице учета.

Если метрика на уровне пользователя, то `trial` — пользователь, а `success` — факт покупки у этого пользователя. Тогда `доля` становится долей покупателей среди пользователей. Смешивать уровни (например, выручку и пользователей) нельзя: это уже не тест для долей. Типичная ошибка — менять знаменатель между группами или использовать разный уровень агрегации.

4Какие допущения делают модель `binomial` разумной для конверсии?
A`trial` обязательно должны быть непрерывными значениями
B`trial` независимы, а шанс `success` примерно одинаковый для каждого `trial`
C`p-value` должен быть меньше 0.05, иначе модель не подходит
D`доля` должна быть близка к 1
Ответ: `binomial` предполагает независимые `trial` и одинаковую вероятность `success`.

В `binomial` модели каждый `trial` имеет один и тот же шанс `p` на `success`, и `trial` считаются независимыми. Это хорошая абстракция для доли покупателей среди пользователей при корректной единице учета. Если `trial` зависимы (например, много событий на одного пользователя), `стандартная ошибка доли` будет оценена неверно. Тогда нужно менять дизайн учета или метод оценки.

5При фиксированном `n` у какой доли стандартная ошибка доли обычно максимальна (по `p*(1-p)`)?
A`p = 0.01`
B`p = 0.10`
C`p = 0.50`
D`p = 0.90`
Ответ: Величина `p*(1-p)` максимальна около `p = 0.5`, поэтому и `SE` там больше.

Формула `SE = sqrt(p*(1-p)/n)` зависит от `p*(1-p)`. Эта часть максимальна при `p = 0.5` и уменьшается, когда `p` близко к 0 или 1. Поэтому при одинаковом `n` доли около 50% дают более шумные оценки. Это полезно для интуитивного планирования экспериментов по конверсии.

1234

Хотите тренировать интерактивно?

В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.

Тренировать в Telegram

Другие темы: Статистика

Хи-квадрат и таблицы сопряжённостиДоверительные интервалыКорреляция и регрессияОписательная статистикаОсновы проверки гипотезМножественные сравненияТочечные оценки и MLEСлучайные величины и выборочные распределенияБутстреп и перестановочные тестыВыборка и смещениеТесты для средних