В A/A-тесте вы заметили значимое отличие по инвариантным метрикам — например, по числу пользователей в эксперименте или по распределению платформ. Что это чаще всего означает?
AАудитория «улучшилась» сама по себе: будущие изменения в продукте сработают ещё лучше, фича уже работает
BЕсть проблема в разбиении или измерениях: группы оказались неэквивалентны, и A/A-тест нельзя считать валидным
CЭто допустимая ситуация: инвариантные метрики не влияют на основные выводы, можно запускать настоящий A/B-тест
DДостаточно увеличить выборку и подождать ещё несколько дней: различие в инвариантных метриках исчезнет
Правильный ответ. Расхождение по инвариантным метрикам в A/A-тесте обычно сигнализирует о проблеме в данных или рандомизации.
Разбор
Инвариантные метрики должны оставаться одинаковыми, потому что продукт и логика одинаковы в обоих вариантах. Если они различаются, значит, в группы попали разные типы пользователей или часть данных теряется несимметрично. В этом случае лучше остановиться и починить разбиение или трекинг до запуска настоящего A/B-теста, иначе любой найденный эффект будет смесью реального и шума разбиения.
Проверь себя · 1/3разбор после ответа
В A/A-тесте вы заметили значимое отличие по инвариантным метрикам — например, по числу пользователей в эксперименте или по распределению платформ. Что это чаще всего означает?
Ещё вопросы по теме «QA, SRM и раскатка»
- Команда готовит крупный A/B-эксперимент и хочет сначала запустить A/A-тест. Какова главная цель A/A-теста?
- Запустили `A/B`-тест с планом 50/50, а в логах видим 53/47 при миллионе пользователей. Что описывает термин `SRM` (Sample Ratio Mismatch) применительно к этой ситуации?
- В эксперименте конверсия в варианте B резко просела, но бизнес подозревает поломку трекинга. Какое действие лучше сделать в первую очередь?
- Эксперимент показал положительный эффект, и вы хотите выкатить фичу на всех пользователей. Какой план выкатки наиболее безопасен?
- В первые сутки эксперимента метрика выросла на 12%, но через 3 дня рост исчез и эффект стал около 0. Какое объяснение наиболее вероятно и что делать дальше?
- Все вопросы по «QA, SRM и раскатка» →