Q: Если `n` увеличили в 4 раза при том же `p`, как примерно изменится стандартная ошибка доли `SE = sqrt(p*(1-p)/n)`?

Стандартная ошибка доли убывает примерно как `1/sqrt(n)`. Формула `SE = sqrt(p*(1-p)/n)` показывает корень из `1/n`. Если `n` выросло в 4 раза, `SE` уменьшается примерно в `sqrt(4) = 2` раза. Это объясняет, почему для маленьких эффектов часто нужна большая выборка. Ошибка — ожидать линейного улучшения точности при росте `n`.

Q: Для разницы долей `p_treat - p_control` вы построили 95% доверительный интервал, и он целиком выше 0. Что это означает для двустороннего теста на уровне `alpha = 0.05`?

Если 95% доверительный интервал для разницы не включает 0, двусторонний тест обычно даёт `p-value < 0.05`. Доверительный интервал и тест гипотез связаны: отсутствие 0 в 95% интервале соответствует отклонению нулевой гипотезы на уровне `alpha = 0.05` для двустороннего теста. Это удобный способ интерпретировать результаты без фокуса только на `p-value`. Типичная ошибка — одновременно говорить «эффект значим» и показывать интервал, который пересекает 0. Всегда проверяйте согласованность интервала и теста — если они расходятся, скорее всего, использовались разные методы оценки.

Q: В A/B-тесте конверсия выросла с 10% до 12%. Какая формулировка наиболее точная и минимизирует путаницу между процентами и процентными пунктами?

Лучше явно называть и абсолютную разницу в процентных пунктах, и относительное изменение, если оно нужно. Абсолютная разница долей здесь равна `12% - 10% = 2` процентных пункта. Относительный рост действительно составляет 20% от исходного уровня, но он не заменяет абсолютную разницу и часто путается в коммуникации. В отчётах по тестам для долей обычно сначала приводят эффект в процентных пунктах, а затем при необходимости добавляют относительную интерпретацию. Типичная ошибка — называть только проценты без указания базового уровня, тогда непонятно, идёт ли речь об абсолютной или относительной разнице.

Question 1

Как корректно интерпретировать 95% доверительный интервал для доли в продуктовом отчёте?

Accepted Answer

Доверительный интервал — это про частоту покрытия истинного параметра интервалами при повторениях, а не про вероятность параметра в конкретной выборке. В классической интерпретации истинный параметр фиксирован, а случайны данные и сам интервал. 95% означает, что процедура построения интервала покрывает истинную долю примерно в 95% повторных выборок. Типичная ошибка — говорить, что у конкретного интервала есть 95% вероятности содержать параметр. Для продуктовых отчётов полезно помнить это различие, чтобы не переуверяться в выводах по одной выборке.

Question 2

Команда считает конверсию из показа в клик: 80 кликов на 1000 показов. Как корректнее всего описать эту величину как долю?

Accepted Answer

Доля — это `x/n`, где `x` успехов из `n` попыток. В задачах про конверсию мы наблюдаем серию попыток, каждая из которых заканчивается успехом или нет. Доля равна числу успехов `x`, делённому на число попыток `n` — это и есть оценка вероятности успеха. Разница долей `p_treat - p_control` — отдельная величина, её обычно тестируют процедурой типа `z-test`. Среднее непрерывной метрики и вероятность `p-value < 0.05` — другие сущности и не имеют отношения к определению доли.

Question 3

Если `n` увеличили в 4 раза при том же `p`, как примерно изменится стандартная ошибка доли `SE = sqrt(p*(1-p)/n)`?

Accepted Answer

Стандартная ошибка доли убывает примерно как `1/sqrt(n)`. Формула `SE = sqrt(p*(1-p)/n)` показывает корень из `1/n`. Если `n` выросло в 4 раза, `SE` уменьшается примерно в `sqrt(4) = 2` раза. Это объясняет, почему для маленьких эффектов часто нужна большая выборка. Ошибка — ожидать линейного улучшения точности при росте `n`.

Question 4

Для разницы долей `p_treat - p_control` вы построили 95% доверительный интервал, и он целиком выше 0. Что это означает для двустороннего теста на уровне `alpha = 0.05`?

Accepted Answer

Если 95% доверительный интервал для разницы не включает 0, двусторонний тест обычно даёт `p-value < 0.05`. Доверительный интервал и тест гипотез связаны: отсутствие 0 в 95% интервале соответствует отклонению нулевой гипотезы на уровне `alpha = 0.05` для двустороннего теста. Это удобный способ интерпретировать результаты без фокуса только на `p-value`. Типичная ошибка — одновременно говорить «эффект значим» и показывать интервал, который пересекает 0. Всегда проверяйте согласованность интервала и теста — если они расходятся, скорее всего, использовались разные методы оценки.

Question 5

В A/B-тесте конверсия выросла с 10% до 12%. Какая формулировка наиболее точная и минимизирует путаницу между процентами и процентными пунктами?

Accepted Answer

Лучше явно называть и абсолютную разницу в процентных пунктах, и относительное изменение, если оно нужно. Абсолютная разница долей здесь равна `12% - 10% = 2` процентных пункта. Относительный рост действительно составляет 20% от исходного уровня, но он не заменяет абсолютную разницу и часто путается в коммуникации. В отчётах по тестам для долей обычно сначала приводят эффект в процентных пунктах, а затем при необходимости добавляют относительную интерпретацию. Типичная ошибка — называть только проценты без указания базового уровня, тогда непонятно, идёт ли речь об абсолютной или относительной разнице.

Тесты для долей: вопросы для собеседования (часть 2)

Вопросы 6–10 из 20

Хотите тренировать интерактивно?

Другие темы: Статистика