В тесте вы заметили, что в варианте B существенно больше iOS-пользователей, хотя фича не должна менять платформу. Что это скорее всего означает?

AНарушены invariant metrics: возможна ошибка рандомизации или таргетинга, и результаты нельзя интерпретировать напрямую
BФича «привлекла» iOS-пользователей и это нормальный эффект
CЭто неважно, если primary metric вырос
DЭто всегда исправляется простым увеличением длительности эксперимента
Правильный ответ. Сильные различия по invariant metrics обычно сигнализируют проблему назначения или сбора данных.

Разбор

Если эксперимент не должен влиять на платформу, страна и другие базовые признаки, то их различия между группами подозрительны. Это может быть следствием некорректного таргетинга, перекоса трафика или ошибки в логировании назначения варианта. В такой ситуации важно сначала восстановить валидность теста, а уже потом обсуждать эффект по метрикам результата.

Проверь себя · 1/3разбор после ответа
Перед анализом результата вы проверяете invariant metrics. Какая метрика чаще всего является invariant metrics в онлайн A/B тесте?
Тренировать A/B в Telegram

Ещё вопросы по теме «Метрики и guardrail-метрики»