z-тест, t-тест (одновыборочный, двухвыборочный, парный), тест Уэлча — основные инструменты для сравнения средних. На собеседовании спрашивают, когда использовать z vs t, что делать при неравных дисперсиях и как проверить предпосылки теста. Сравнение средних — ядро большинства аналитических задач.
При больших n среднее часто становится близким к нормальному из-за эффекта усреднения, и `t-test` обычно устойчивее. При малых n и сильных перекосах/выбросах стандартные предпосылки могут нарушаться, и результат становится менее надёжным. Типичная ошибка — игнорировать форму распределения при n=20–30 и принимать выводы без проверки здравого смысла.
Подробный разбор →`CI` показывает диапазон правдоподобных значений разницы средних по данным, здесь это 0.2–1.0 секунды. Так как 0 не входит в интервал, нулевая разница несовместима с данными на уровне 95%, и `H0` обычно отвергают при `alpha=0.05`. Типичная ошибка — думать, что нижняя граница и есть 'точное значение' эффекта.
Подробный разбор →Welch вариант корректирует расчёт стандартной ошибки и степеней свободы, когда дисперсии и/или размеры групп отличаются. Это делает выводы более надёжными при неравных разбросах. Типичная ошибка — автоматически использовать pooled вариант и получить смещение уровня ошибок, особенно при разных размерах групп.
Подробный разбор →Парный тест фактически делает `t-test` для одной выборки разностей `d`. Поэтому важно, чтобы распределение `d` было примерно нормальным (особенно при малых n). При больших выборках тест часто достаточно устойчив, но сильные перекосы и выбросы могут мешать. Ошибка — проверять «нормальность» по каждой группе отдельно и забывать про разности.
Подробный разбор →При огромных выборках даже очень маленькие эффекты становятся статистически значимыми. Поэтому рядом с `p-value` нужно смотреть оценку эффекта и `CI`, чтобы понять масштаб и неопределённость. Типичная ошибка — принимать 'значимо' за 'важно для бизнеса' без оценки величины и стоимости изменений.
Подробный разбор →В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.
Тренировать статистику в Telegram