В тесте chi-square на независимость вы получили большой p-value (например, 0.4). Какой вывод наиболее корректен?
AКатегории
A и B точно независимы, и дальнейший анализ связи между ними можно полностью прекратить как избыточный.BЭто означает, что данные в таблице сопряжённости плохого качества и их следует выбросить перед проведением любого теста.
CЭффект между категориями точно равен нулю и не сможет проявиться даже при существенно большем объёме собранных данных.
DНет оснований отвергнуть гипотезу
H0 о независимости категорий, но это не является доказательством их независимости.Правильный ответ. Большой
p-value значит, что нет оснований отвергнуть H0, но это не доказательство независимости категорий.Разбор
Если p-value велик, данные совместимы с гипотезой H0 о независимости категорий на выбранном уровне значимости. Это не означает, что связь отсутствует: эффект может быть маленьким, либо данных может быть недостаточно для его обнаружения. Типичная ошибка — писать «категории независимы» вместо «не нашли статистических оснований для зависимости».
Проверь себя · 1/3разбор после ответа
Если в таблице сопряжённости поменять местами строки и столбцы, изменится ли результат теста независимости
chi-square (значение статистики, число степеней свободы, p-value)?Ещё вопросы по теме «Хи-квадрат и таблицы сопряжённости»
- У вас датасет с полями `user_id`, тип устройства (iOS/Android) и признак конверсии (да/нет). Какую таблицу сопряжённости вы построите перед тестом независимости (`chi-square`)?
- Какой смысл у `H0` в тесте `chi-square` на независимость для таблицы сопряжённости?
- В таблице сопряжённости для контрольной и тестовой группы и исхода (купил/не купил) в ячейке (тестовая группа, купил) стоит число 250. Что это означает?
- Как по таблице сопряжённости считается ожидаемое значение (ячейка) при `H0` о независимости категорий в `chi-square` тесте?
- В каком случае выводы `chi-square` теста независимости стоит интерпретировать с осторожностью?
- Все вопросы по «Хи-квадрат и таблицы сопряжённости» →