У вас таблица с количеством пользователей по вариантам A/B и по 4 источникам трафика. Нужно проверить, что распределение источников одинаковое в A и B. Какой тест чаще всего используют?

At-test для сравнения средних: критерий применяется к двум выборкам числовой метрики
Bz-test для долей: критерий применяется к двум долям из бинарного исхода в группах
CСравнение медиан категориальной переменной: используется ранговый критерий по значениям
Dchi-square тест независимости в таблице сопряжённости: сравнение распределений по категориям
Правильный ответ. Для сравнения распределения по категориям между группами обычно применяют chi-square тест независимости.

Разбор

Когда данные представлены в виде таблицы частот по категориям, естественно проверить независимость признаков «вариант» и «источник». chi-square оценивает, насколько наблюдаемые частоты отклоняются от ожидаемых при независимости, и подходит для нескольких категорий сразу. Это часто используют для проверки рандомизации или для категориальных исходов; t-test и z-test тут не подходят, а медиана неприменима к номинальной шкале.

Проверь себя · 1/3разбор после ответа
Для разницы конверсий вы построили 95% доверительный интервал: от -0.2% до +1.4%. Что можно сказать о статистической значимости при уровне значимости 0.05 и двусторонней проверке?
Тренировать A/B в Telegram

Ещё вопросы по теме «Проверка гипотез и доверительные интервалы»