В каждом из трёх городов канал A показывает конверсию выше, чем канал B. Но в сумме по всем городам канал B лидирует. Как такое возможно?

AДанные содержат ошибку — невозможно, чтобы в каждом городе было лучше, а в сумме хуже
BСредняя конверсия по компании выше, потому что общий объём трафика больше у лучшего канала
CПарадокс Симпсона: доли трафика по каналам различаются между городами, что меняет итог
DСтатистическая значимость различий недостаточна из-за малого объёма выборки в каждом городе
Правильный ответ. Это парадокс Симпсона: канал B получает больше трафика в городе с высокой базовой конверсией, что перевешивает при агрегации.

Разбор

Парадокс Симпсона возникает, когда тренд внутри подгрупп меняется на противоположный при объединении. Причина — неравномерное распределение наблюдений по группам. Если канал B получает 90% трафика из города с конверсией 15%, а канал A — 90% из города с конверсией 3%, общий средний B будет выше, хотя в каждом городе A лидирует. Решение — анализировать данные с учётом структуры подгрупп.

Проверь себя · 1/3разбор после ответа
Если величина измеряется в минутах, в каких единицах измеряется std этой величины?
Тренировать статистику в Telegram

Ещё вопросы по теме «Описательная статистика»