В таблице сопряженности строки — control/treatment, столбцы — купил/не купил. Какие проценты чаще всего полезнее считать, чтобы сравнить конверсию между группами и сформировать гипотезу до chi-square?
AПроценты внутри столбцов (column percentages) по всей таблице
BПроценты от общего итога таблицы для каждой ячейки
CПроценты внутри строк (row percentages), то есть долю 'купил' внутри каждой группы
DПроизведение процентов строк и столбцов
Правильный ответ. Для сравнения конверсии между группами в таблице сопряженности обычно смотрят доли внутри строк (row percentages).
Разбор
Если строки — control/treatment, то доля покупки должна считаться внутри каждой строки, чтобы сравнить вероятность исхода в группе. Общие проценты по всей таблице могут скрыть разницу, если размеры групп разные. Это помогает читать таблицу сопряженности как источник гипотез перед формальным chi-square.
Проверь себя · 1/3разбор после ответа
Какой смысл у
H0 в chi-square тесте независимости для таблицы сопряжённости?Ещё вопросы по теме «Хи-квадрат и таблицы сопряжённости»
- У вас датасет с полями `user_id`, `device` (iOS/Android) и `converted` (да/нет). Какую таблицу сопряжённости вы построите перед `chi-square` тестом независимости?
- Какой смысл у `H0` в `chi-square` тесте независимости для таблицы сопряжённости?
- В таблице сопряжённости для `control/treatment` и исхода (купил/не купил) в ячейке (treatment, купил) стоит число 250. Что это означает?
- Как по таблице сопряжённости считается ожидаемое значение (ячейка) при `H0` о независимости категорий в `chi-square` тесте?
- В каком случае выводы `chi-square` теста независимости стоит интерпретировать с осторожностью?
- Все вопросы по «Хи-квадрат и таблицы сопряжённости» →