В таблице сопряжённости есть ячейка с наблюдаемой частотой 0 (например, в одном сегменте никто не купил). Что важнее всего проверить перед выводами по chi-square?
AСчитать
p-value теста недействительным при любом наблюдаемом нуле в ячейке таблицыBУдалить сегмент с нулём из таблицы, чтобы он не искажал общую статистику
CЗаменять наблюдаемые нули на единицу для устойчивости теста независимо от ожидаемых частот
DПроверить ожидаемые частоты в ячейке: при малых значениях тест ненадёжен, при больших ноль допустим
Правильный ответ. Ноль в наблюдаемой ячейке сам по себе не запрет на тест, но важно проверить ожидаемые частоты в этой ячейке.
Разбор
Если ожидаемые частоты в ячейке тоже малы, приближение chi-square может работать хуже. Если же ожидаемое значение достаточно велико, наблюдаемый ноль — это сильное отклонение и может дать большой вклад в статистику. Типичная ошибка — автоматически «лечить» нули без проверки ожидаемых значений.
Проверь себя · 1/3разбор после ответа
У вас есть только проценты конверсии по группам, но нет абсолютных размеров групп. Можно ли корректно провести тест хи-квадрат на независимость?
Ещё вопросы по теме «Хи-квадрат и таблицы сопряжённости»
- У вас датасет с полями `user_id`, тип устройства (iOS/Android) и признак конверсии (да/нет). Какую таблицу сопряжённости вы построите перед тестом независимости (`chi-square`)?
- Какой смысл у `H0` в тесте `chi-square` на независимость для таблицы сопряжённости?
- В таблице сопряжённости для контрольной и тестовой группы и исхода (купил/не купил) в ячейке (тестовая группа, купил) стоит число 250. Что это означает?
- Как по таблице сопряжённости считается ожидаемое значение (ячейка) при `H0` о независимости категорий в `chi-square` тесте?
- В каком случае выводы `chi-square` теста независимости стоит интерпретировать с осторожностью?
- Все вопросы по «Хи-квадрат и таблицы сопряжённости» →