В таблице сопряжённости строки — это группы (контроль и тест), а столбцы — купил/не купил. Какие проценты обычно полезнее считать, чтобы сравнить конверсию между группами и сформулировать гипотезу до теста хи-квадрат?
AПроценты внутри столбцов: считать долю строки внутри каждого столбца, чтобы увидеть распределение групп среди купивших и среди не купивших
BПроценты от общего итога таблицы: для каждой ячейки делить её значение на сумму всей таблицы, без учёта структуры строк и столбцов
CПроценты внутри строк: для каждой группы считать долю «купил» относительно размера группы, чтобы прямо сравнивать конверсию между ними
DПроизведение процентов строк и столбцов: перемножать долю строки и долю столбца, чтобы получить ожидаемое значение в каждой ячейке
Правильный ответ. Для сравнения конверсии между группами в таблице сопряжённости обычно смотрят доли внутри строк.
Разбор
Если строки — это группы (контроль и тест), долю покупки разумно считать внутри каждой строки: тогда мы напрямую сравниваем вероятность исхода в каждой группе. Проценты от общего итога таблицы могут скрывать разницу, если группы разного размера. Проценты внутри столбцов отвечают на другой вопрос — как распределены группы среди купивших, а не как различаются конверсии между группами. Произведение долей по строкам и столбцам — это ожидаемые частоты при независимости, а не наблюдённые конверсии.
Проверь себя · 1/3разбор после ответа
Как по таблице сопряжённости считается ожидаемое значение (ячейка) при
H0 о независимости категорий в chi-square тесте?Ещё вопросы по теме «Хи-квадрат и таблицы сопряжённости»
- У вас датасет с полями `user_id`, тип устройства (iOS/Android) и признак конверсии (да/нет). Какую таблицу сопряжённости вы построите перед тестом независимости (`chi-square`)?
- Какой смысл у `H0` в тесте `chi-square` на независимость для таблицы сопряжённости?
- В таблице сопряжённости для контрольной и тестовой группы и исхода (купил/не купил) в ячейке (тестовая группа, купил) стоит число 250. Что это означает?
- Как по таблице сопряжённости считается ожидаемое значение (ячейка) при `H0` о независимости категорий в `chi-square` тесте?
- В каком случае выводы `chi-square` теста независимости стоит интерпретировать с осторожностью?
- Все вопросы по «Хи-квадрат и таблицы сопряжённости» →