t-test vs z-test: разница и когда что использовать на собесе
t-test и z-test — два теста на разницу средних. Главное различие — что мы знаем о дисперсии и какой размер выборки. На собесе спрашивают, какой выбирать в реальной задаче.
Если коротко. t-test — когда дисперсия неизвестна и/или выборка малая. z-test — когда дисперсия известна или выборка большая (n > 30).
Проверь себя · 1/3разбор после ответа
Аналитик построил пятичисловую сводку (five-number summary) для набора данных. Какие именно пять статистик входят в эту сводку?
t-test vs z-test: таблица различий
Когда использовать t-test
- Выборка маленькая (n < 30) и дисперсия неизвестна.
- Сравниваете средние двух групп (independent t-test).
- Хотите учесть неопределённость в оценке дисперсии.
Когда использовать z-test
- Дисперсия популяции известна (редкость в реальности).
- Размер выборки большой (n > 30) — t-распределение сходится к нормальному.
- Делаете проверку доли (z-test for proportions).
Ловушка на собесе
На собесе любят: «у нас выборка 100 000, какой тест?». Формально подойдёт z-test, но t-test даст почти тот же результат и безопаснее с точки зрения интервалов. В индустрии обычно везде t-test — он адаптируется автоматически.