Вы посчитали конверсию как долю успешных сессий среди всех сессий, но один пользователь может создавать много сессий. Какой главный риск для теста долей?

AРиск отсутствует, потому что больше сессий означает больше точности
BНарушается независимость trial, и стандартная ошибка доли может быть занижена; лучше агрегировать до user_id или учитывать кластеризацию
CЭто автоматически делает p-value равным 0
DНужно просто поменять z-test на точный binomial тест, и все исправится
Правильный ответ. Если trial не независимы, то оценка стандартной ошибки доли и p-value могут быть неверными.

Разбор

Много сессий одного пользователя обычно коррелируют, поэтому считать их независимыми trial опасно. Это часто приводит к завышенной уверенности: SE становится слишком маленькой, и тест чаще показывает значимость. Типичный выход — считать долю на уровне пользователя или использовать методы, учитывающие зависимость внутри пользователя. Ошибка — игнорировать единицу анализа и радоваться 'очень значимому' результату.

Проверь себя · 1/3разбор после ответа
Если n увеличили в 4 раза при том же p, как примерно изменится стандартная ошибка доли SE = sqrt(p*(1-p)/n)?
Тренировать статистику в Telegram

Ещё вопросы по теме «Тесты для долей»