Вы хотите сравнить три варианта A/B/C вместо классического A/B при том же общем трафике и тех же alpha, мощности и MDE на каждое сравнение. Что будет с длительностью теста для набора нужного размера выборки в каждой группе?

AДлительность теста сократится, потому что больше вариантов ускоряют сбор данных и набор статистической мощности на каждое сравнение
BДлительность теста не изменится, потому что общий поток трафика остаётся прежним и в сумме мы видим столько же пользователей за период
CДлительность теста вырастет, потому что трафик делится на 3 группы и нужный размер выборки в каждой набирается медленнее, чем при двух группах
DДлительность теста станет меньше, потому что уровень значимости alpha автоматически делится на 3 при увеличении числа вариантов в тесте
Правильный ответ. При трёх вариантах трафик на группу меньше, поэтому для того же размера выборки обычно нужна большая длительность теста.

Разбор

Если общий поток пользователей фиксирован, то при трёх группах каждая получает около одной трети трафика вместо половины. Чтобы набрать тот же размер выборки на группу, потребуется больше времени. Дополнительно множественные сравнения могут потребовать контроля alpha на уровне набора гипотез — но сам по себе этот контроль длительность не сокращает. Идея, что больше вариантов ускоряют тест или что alpha сама делится на 3 в нашу пользу, — частые ошибки.

Проверь себя · 1/3разбор после ответа
Калькулятор размера выборки дал требование N_treat = 20000 и N_control = 20000. В эксперимент ежедневно попадает 5000 новых пользователей при разбиении 50/50. Какова минимальная длительность теста в днях при стабильном трафике?
Тренировать A/B в Telegram

Ещё вопросы по теме «Размер выборки и мощность теста»