В таблице сопряжённости есть ячейка с observed count равным 0 (например, в одном сегменте никто не купил). Что важнее всего проверить перед выводами по chi-square?

AСразу удалить этот сегмент из данных
BВсегда заменять нули на 1, чтобы тест работал
CПосмотреть ожидаемые частоты: если они малы, тест может быть ненадёжным; если нет — ноль допустим
DСчитать p-value недействительным при любом нуле
Правильный ответ. Ноль в наблюдаемой ячейке сам по себе не запрет, важны ожидаемые частоты.

Разбор

Если ожидаемые частоты в ячейке тоже малы, приближение chi-square может работать хуже. Если же ожидаемое значение достаточно велико, наблюдаемый ноль — это сильное отклонение и может дать большой вклад в статистику. Типичная ошибка — автоматически «лечить» нули без проверки ожиданий.

Проверь себя · 1/3разбор после ответа
У вас датасет с полями user_id, device (iOS/Android) и converted (да/нет). Какую таблицу сопряжённости вы построите перед chi-square тестом независимости?
Тренировать статистику в Telegram

Ещё вопросы по теме «Хи-квадрат и таблицы сопряжённости»