Как по таблице сопряжённости считается ожидаемое значение (ячейка) при H0 о независимости категорий в chi-square тесте?
A
E = observed / grand_totalB
E = row_total - col_totalC
E = grand_total / (row_total + col_total)D
E = row_total * col_total / grand_totalПравильный ответ. Ожидаемые частоты при
H0 считаются из маргинальных сумм: E = row_total * col_total / grand_total.Разбор
Если H0 — независимость категорий, то доля столбца должна быть одинаковой в каждой строке. Поэтому ожидаемая частота в ячейке равна произведению суммы строки и суммы столбца, делённому на общий итог. Частая ошибка — сравнивать только проценты, не проверяя, что базовые объёмы сопоставимы.
Проверь себя · 1/3разбор после ответа
В таблице сопряжённости для
control/treatment и исхода (купил/не купил) в ячейке (treatment, купил) стоит число 250. Что это означает?Ещё вопросы по теме «Хи-квадрат и таблицы сопряжённости»
- У вас датасет с полями `user_id`, `device` (iOS/Android) и `converted` (да/нет). Какую таблицу сопряжённости вы построите перед `chi-square` тестом независимости?
- Какой смысл у `H0` в `chi-square` тесте независимости для таблицы сопряжённости?
- В таблице сопряжённости для `control/treatment` и исхода (купил/не купил) в ячейке (treatment, купил) стоит число 250. Что это означает?
- В каком случае выводы `chi-square` теста независимости стоит интерпретировать с осторожностью?
- У вас 12 регионов, и несколько регионов дают очень малые counts, из-за чего появляются маленькие `ожидаемые частоты`. Какой шаг чаще всего помогает перед применением `chi-square`?
- Все вопросы по «Хи-квадрат и таблицы сопряжённости» →