В таблице сопряжённости есть ячейка с наблюдаемой частотой 0 (например, в одном сегменте никто не купил). Что важнее всего проверить перед выводами по chi-square?

AСчитать p-value теста недействительным при любом наблюдаемом нуле в ячейке таблицы
BУдалить сегмент с нулём из таблицы, чтобы он не искажал общую статистику
CЗаменять наблюдаемые нули на единицу для устойчивости теста независимо от ожидаемых частот
DПроверить ожидаемые частоты в ячейке: при малых значениях тест ненадёжен, при больших ноль допустим
Правильный ответ. Ноль в наблюдаемой ячейке сам по себе не запрет на тест, но важно проверить ожидаемые частоты в этой ячейке.

Разбор

Если ожидаемые частоты в ячейке тоже малы, приближение chi-square может работать хуже. Если же ожидаемое значение достаточно велико, наблюдаемый ноль — это сильное отклонение и может дать большой вклад в статистику. Типичная ошибка — автоматически «лечить» нули без проверки ожидаемых значений.

Проверь себя · 1/3разбор после ответа
У вас есть только проценты конверсии по группам, но нет абсолютных размеров групп. Можно ли корректно провести тест хи-квадрат на независимость?
Тренировать статистику в Telegram

Ещё вопросы по теме «Хи-квадрат и таблицы сопряжённости»