Вы посчитали конверсию как долю успешных сессий среди всех сессий, но один пользователь может создавать много сессий. Какой главный риск для теста долей?

Question

Карьерник · Accepted Answer

Правильный ответ: Нарушается независимость испытаний внутри пользователя, стандартная ошибка занижается, и лучше агрегировать долю до `user_id` или учитывать кластеризацию. Если испытания не независимы, то оценка стандартной ошибки доли и `p-value` могут быть неверными. Сессии одного пользователя обычно коррелируют, поэтому считать их независимыми испытаниями опасно. Это часто приводит к завышенной уверенности: стандартная ошибка становится слишком маленькой, и тест чаще показывает значимость. Типичный выход — считать долю на уровне пользователя или использовать методы, учитывающие зависимость внутри пользователя. Ошибка — игнорировать единицу анализа и радоваться очень значимому результату.

Вы посчитали конверсию как долю успешных сессий среди всех сессий, но один пользователь может создавать много сессий. Какой главный риск для теста долей?

Разбор

Ещё вопросы по теме «Тесты для долей»