Вы распределяете трафик не 50/50, а 90/10 в пользу `treatment` при фиксированном общем трафике. Что ожидаемо произойдёт с мощностью теста для сравнения `treatment` vs `control` при той же длительности?

Question

Карьерник · Accepted Answer

Правильный ответ: Мощность обычно падает: маленькая контрольная группа увеличивает дисперсию разницы, поэтому для прежнего уровня нужен больший размер выборки или длительность теста. При 90/10 и фиксированном общем трафике мощность обычно падает: точность сравнения ограничена маленькой группой `control`. При распределении 90/10 самая маленькая группа `control` задаёт точность оценки разницы. Это увеличивает дисперсию оценок и снижает мощность при той же длительности теста. Чтобы вернуть прежний уровень мощности, обычно требуется увеличить общий размер выборки или длительность. Вариант «мощность вырастет из-за большого `treatment`» путает «больше данных в одной группе» с «точность сравнения»; вариант «не изменится при том же `alpha`» игнорирует роль дисперсии разницы; «MDE меняется, а мощность нет» противоречит формуле размера выборки.

Разбор

Ещё вопросы по теме «Размер выборки и мощность теста»