Вы строите таблицу сопряжённости по событиям кликов, но один пользователь может сделать десятки кликов. Почему это может быть проблемой для chi-square теста независимости?

AПотому что chi-square работает только для данных по пользователям, а не по событиям
BПотому что клики нельзя считать, их нужно усреднять
CПотому что нарушается предпосылка независимых наблюдений, и p-value может стать искусственно маленьким
DПотому что ожидаемые частоты всегда должны быть ровно одинаковыми
Правильный ответ. chi-square предполагает независимые наблюдения, поэтому важно выбрать правильную единицу анализа.

Разбор

Если один пользователь даёт много событий, строки в таблице сопряжённости перестают быть независимыми. Тогда p-value может стать слишком маленьким, потому что вы завышаете эффективный размер выборки. Частое решение — агрегировать до уровня пользователя или сессии и уже потом строить таблицу.

Проверь себя · 1/3разбор после ответа
У вас датасет с полями user_id, device (iOS/Android) и converted (да/нет). Какую таблицу сопряжённости вы построите перед chi-square тестом независимости?
Тренировать статистику в Telegram

Ещё вопросы по теме «Хи-квадрат и таблицы сопряжённости»