В chi-square тесте независимости вы получили большой p-value (например, 0.4). Какой вывод наиболее корректен?
AКатегории точно независимы, можно забыть про анализ
BЭто означает, что данные плохого качества и их нужно выбросить
CЭффект точно равен нулю, и он не может появиться при большем объёме данных
DНет оснований отвергнуть
H0 о независимости категорий, но это не доказательство независимостиПравильный ответ. Большой
p-value значит, что нет оснований отвергнуть H0, но это не доказательство независимости категорий.Разбор
Если p-value велик, данные совместимы с H0 о независимости категорий на выбранном уровне значимости. Это не означает, что связь отсутствует: эффект может быть маленьким или данных может быть недостаточно. Типичная ошибка — писать «категории независимы», вместо «не нашли статистических оснований для зависимости».
Проверь себя · 1/3разбор после ответа
Вы нашли значимую связь в таблице сопряжённости между каналом привлечения и покупкой с помощью
chi-square. Можно ли сделать вывод, что канал вызывает покупку?Ещё вопросы по теме «Хи-квадрат и таблицы сопряжённости»
- У вас датасет с полями `user_id`, `device` (iOS/Android) и `converted` (да/нет). Какую таблицу сопряжённости вы построите перед `chi-square` тестом независимости?
- Какой смысл у `H0` в `chi-square` тесте независимости для таблицы сопряжённости?
- В таблице сопряжённости для `control/treatment` и исхода (купил/не купил) в ячейке (treatment, купил) стоит число 250. Что это означает?
- Как по таблице сопряжённости считается ожидаемое значение (ячейка) при `H0` о независимости категорий в `chi-square` тесте?
- В каком случае выводы `chi-square` теста независимости стоит интерпретировать с осторожностью?
- Все вопросы по «Хи-квадрат и таблицы сопряжённости» →