У вас датасет с полями user_id, тип устройства (iOS/Android) и признак конверсии (да/нет). Какую таблицу сопряжённости вы построите перед тестом независимости (chi-square)?
AСписок
user_id с указанием выручки за неделю и категорией устройства каждой строки в исходной разрезкеBСредняя конверсия по всем пользователям одной цифрой без разбиения по типу устройства и без разделения групп
CСтроки тип устройства, столбцы признак конверсии, в ячейках число пользователей с такой комбинацией признаков
DГрафик конверсии по дням без разбиения на устройства, чтобы увидеть динамику метрики во времени за период
Правильный ответ. Для
chi-square нужна таблица сопряжённости с абсолютными счетчиками по двум категориальным признакам.Разбор
В таблице сопряжённости строки и столбцы — категории двух признаков, а в ячейках — число наблюдений. Для типа устройства и признака конверсии это будет таблица 2×2 с числом пользователей в каждой ячейке. Типичная ошибка — подставлять проценты вместо абсолютных счётчиков и терять информацию о размере групп.
Проверь себя · 1/3разбор после ответа
Какой смысл у
H0 в тесте chi-square на независимость для таблицы сопряжённости?Ещё вопросы по теме «Хи-квадрат и таблицы сопряжённости»
- Какой смысл у `H0` в тесте `chi-square` на независимость для таблицы сопряжённости?
- В таблице сопряжённости для контрольной и тестовой группы и исхода (купил/не купил) в ячейке (тестовая группа, купил) стоит число 250. Что это означает?
- Как по таблице сопряжённости считается ожидаемое значение (ячейка) при `H0` о независимости категорий в `chi-square` тесте?
- В каком случае выводы `chi-square` теста независимости стоит интерпретировать с осторожностью?
- У вас 12 регионов, и несколько регионов дают очень малые counts, из-за чего появляются маленькие `ожидаемые частоты`. Какой шаг чаще всего помогает перед применением `chi-square`?
- Все вопросы по «Хи-квадрат и таблицы сопряжённости» →