В каком случае выводы chi-square теста независимости стоит интерпретировать с осторожностью?
AКогда выборка большая и много наблюдений
BКогда в таблице есть несколько ячеек с малыми ожидаемыми частотами
CКогда признаки выглядят независимыми визуально
DКогда таблица сопряжённости имеет размер 2×2
Правильный ответ. Если
ожидаемые частоты слишком маленькие, приближение chi-square работает хуже.Разбор
χ²-приближение предполагает, что ожидаемых наблюдений в ячейках достаточно много. Когда ожидаемые частоты малы, p-value может быть ненадёжным. В таких случаях часто объединяют редкие категории или используют альтернативу, например Fisher's exact test для 2×2.
Проверь себя · 1/3разбор после ответа
В таблице сопряженности строки —
control/treatment, столбцы — купил/не купил. Какие проценты чаще всего полезнее считать, чтобы сравнить конверсию между группами и сформировать гипотезу до chi-square?Ещё вопросы по теме «Хи-квадрат и таблицы сопряжённости»
- У вас датасет с полями `user_id`, `device` (iOS/Android) и `converted` (да/нет). Какую таблицу сопряжённости вы построите перед `chi-square` тестом независимости?
- Какой смысл у `H0` в `chi-square` тесте независимости для таблицы сопряжённости?
- В таблице сопряжённости для `control/treatment` и исхода (купил/не купил) в ячейке (treatment, купил) стоит число 250. Что это означает?
- Как по таблице сопряжённости считается ожидаемое значение (ячейка) при `H0` о независимости категорий в `chi-square` тесте?
- У вас 12 регионов, и несколько регионов дают очень малые counts, из-за чего появляются маленькие `ожидаемые частоты`. Какой шаг чаще всего помогает перед применением `chi-square`?
- Все вопросы по «Хи-квадрат и таблицы сопряжённости» →