В A/B тесте вариант B лучше по конверсии внутри каждого региона, но общая конверсия по всем регионам хуже в B. Какое объяснение наиболее правдоподобно?

AЭто парадокс Симпсона: из-за сдвиг микса общий результат как взвешенное среднее меняет знак при других веса
BЭто означает, что взвешенное среднее всегда неверен, поэтому надо брать простое среднее
CСегменты нужно игнорировать: решение принимается только по общей метрике
DЭто обязательно означает ошибку логирования только в одном регионе, остальное можно не проверять
Правильный ответ. Когда общий эффект противоречит эффектам в каждом сегменте, это типичный парадокс Симпсона, связанный с сдвиг микса.

Разбор

Такое возможно, если доли регионов в вариантах разные и веса сегментов изменились. Тогда общий результат становится взвешенное среднее сегментов с другими веса, и знак может перевернуться. Первый шаг — убедиться, что сравнение идёт на одном уровень агрегации и нет перекоса в составе. Затем интерпретировать эффект по сегментам или стандартизировать с фиксированными веса.

Проверь себя · 1/3разбор после ответа
У вас есть средняя длительность сессии по дням и число сессий по дням. Как корректно получить среднюю длительность сессии за неделю, чтобы не попасть в среднее средних?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Взвешенные средние и смешение»