Q: В `t-test` получено `p-value=0.03` при `alpha=0.05`. Какое решение соответствует правилу проверки гипотез?

Если `p-value < alpha`, то `H0` обычно отвергают. Базовое правило проверки гипотез: если `p-value` меньше заранее зафиксированного уровня `alpha`, нулевую гипотезу отвергаем. Здесь `0.03 < 0.05`, поэтому `H0` отвергаем на уровне 0.05. Сравнивать с другим уровнем (0.01) задним числом — нарушение протокола. Альтернативная гипотеза не «отвергается» — отвергают только нулевую; маленький `p-value` свидетельствует против `H0`, а не против `H1`. Проверка предположений (нормальность, равенство дисперсий) важна, но если они уже учтены при выборе варианта `t-test`, формальное решение делается стандартным правилом.

Q: Как выглядит стандартная нулевая гипотеза `H0` в двухвыборочном `t-test` для средних?

В `t-test` обычно проверяют `H0` об отсутствии эффекта: разница средних равна нулю. В двухвыборочном `t-test` для средних нулевая гипотеза формулируется как равенство средних: `μA = μB`, или эквивалентно `μA - μB = 0`. Альтернатива двусторонняя `H1: μA - μB ≠ 0` или односторонняя в зависимости от дизайна. Равенство дисперсий — это отдельное предположение, проверяемое тестом Левена и определяющее выбор между обычным `t-test` и `Welch t-test`, но не саму `H0`. Нормальность — допущение модели, не нулевая гипотеза. `H0: μA - μB > 0` — это альтернативная гипотеза, а не нулевая.

Question 1

Что означает предпосылка «равенство дисперсий» в независимом t-тесте, если объяснять её интуитивно?

Accepted Answer

Предпосылка относится к разбросу (дисперсии) внутри групп, а не к равенству средних значений. В классическом pooled-варианте независимого t-теста предполагается, что вариативность метрики в группах похожа. Тогда можно оценивать общую дисперсию и корректно считать стандартную ошибку. Если разбросы сильно различаются, лучше использовать вариант Уэлча. Частая ошибка — путать «равенство дисперсий» с равенством средних: предпосылка касается именно разброса, а не уровня метрики.

Question 2

Вы измерили среднее время выполнения задачи у одних и тех же 40 пользователей до и после изменения интерфейса. Какой тест для сравнения средних здесь уместен?

Accepted Answer

Если измерения сделаны у одних и тех же объектов до и после, выбирайте парный `t-test` по разностям. В парном дизайне каждое наблюдение «после» связано с конкретным «до», поэтому анализируют разности `d = after - before`. Это обычно уменьшает шум и повышает чувствительность по сравнению с непарным тестом. Частая ошибка — считать группы независимыми и терять информацию о парности или применять тесты для долей и категорий к непрерывной метрике времени.

Question 3

В `t-test` получено `p-value=0.03` при `alpha=0.05`. Какое решение соответствует правилу проверки гипотез?

Accepted Answer

Если `p-value < alpha`, то `H0` обычно отвергают. Базовое правило проверки гипотез: если `p-value` меньше заранее зафиксированного уровня `alpha`, нулевую гипотезу отвергаем. Здесь `0.03 < 0.05`, поэтому `H0` отвергаем на уровне 0.05. Сравнивать с другим уровнем (0.01) задним числом — нарушение протокола. Альтернативная гипотеза не «отвергается» — отвергают только нулевую; маленький `p-value` свидетельствует против `H0`, а не против `H1`. Проверка предположений (нормальность, равенство дисперсий) важна, но если они уже учтены при выборе варианта `t-test`, формальное решение делается стандартным правилом.

Question 4

Как выглядит стандартная нулевая гипотеза `H0` в двухвыборочном `t-test` для средних?

Accepted Answer

В `t-test` обычно проверяют `H0` об отсутствии эффекта: разница средних равна нулю. В двухвыборочном `t-test` для средних нулевая гипотеза формулируется как равенство средних: `μA = μB`, или эквивалентно `μA - μB = 0`. Альтернатива двусторонняя `H1: μA - μB ≠ 0` или односторонняя в зависимости от дизайна. Равенство дисперсий — это отдельное предположение, проверяемое тестом Левена и определяющее выбор между обычным `t-test` и `Welch t-test`, но не саму `H0`. Нормальность — допущение модели, не нулевая гипотеза. `H0: μA - μB > 0` — это альтернативная гипотеза, а не нулевая.

Question 5

20 пользователей по очереди используют два дизайна (`A` и `B`), и для каждого пользователя измерено время выполнения задачи в обоих вариантах. Какой `t-test` подходит для сравнения средних времён?

Accepted Answer

Если один и тот же пользователь измеряется в `A` и `B`, это парные наблюдения и нужен парный `t-test`. В кроссовер-дизайне каждое наблюдение в `A` связано с наблюдением в `B` для того же пользователя. Парный тест работает с разностями по пользователю и обычно даёт более точное сравнение, чем непарный. Типичная ошибка — игнорировать парность и сравнивать как независимые группы, теряя точность из-за межпользовательской вариации.

Вопросы по теме «Тесты для средних»

Вопросы 1–5 из 20

Хотите тренировать интерактивно?

Другие темы: Статистика