В каждом из трёх городов канал A показывает конверсию выше, чем канал B. Но в сумме по всем городам канал B лидирует. Как такое возможно?
AДанные содержат ошибку — невозможно, чтобы в каждом городе было лучше, а в сумме хуже
BСредняя конверсия по компании выше, потому что общий объём трафика больше у лучшего канала
CПарадокс Симпсона: доли трафика по каналам различаются между городами, что меняет итог
DСтатистическая значимость различий недостаточна из-за малого объёма выборки в каждом городе
Правильный ответ. Это парадокс Симпсона: канал B получает больше трафика в городе с высокой базовой конверсией, что перевешивает при агрегации.
Разбор
Парадокс Симпсона возникает, когда тренд внутри подгрупп меняется на противоположный при объединении. Причина — неравномерное распределение наблюдений по группам. Если канал B получает 90% трафика из города с конверсией 15%, а канал A — 90% из города с конверсией 3%, общий средний B будет выше, хотя в каждом городе A лидирует. Решение — анализировать данные с учётом структуры подгрупп.
Проверь себя · 1/3разбор после ответа
Если величина измеряется в минутах, в каких единицах измеряется
std этой величины?Ещё вопросы по теме «Описательная статистика»
- Для набора значений 2, 4, 6, 8 чему равно `mean`?
- Даны значения 1, 3, 7, 9, 10. Чему равна `median`?
- Для набора 1, 2, 2, 3, 3, 3, 4 чему равна `mode`?
- В отчёте о зарплатах есть редкие очень большие значения (`выбросы`). Какую меру центра обычно лучше использовать вместо `mean`, чтобы не исказить картину?
- Как обычно называют `quantile` уровня 0.25?
- Все вопросы по «Описательная статистика» →