t-test vs z-test: разница и когда что использовать на собесе

t-test и z-test — два теста на разницу средних. Главное различие — что мы знаем о дисперсии и какой размер выборки. На собесе спрашивают, какой выбирать в реальной задаче.

Если коротко. t-test — когда дисперсия неизвестна и/или выборка малая. z-test — когда дисперсия известна или выборка большая (n > 30).
Проверь себя · 1/3разбор после ответа
Аналитик построил пятичисловую сводку (five-number summary) для набора данных. Какие именно пять статистик входят в эту сводку?

t-test vs z-test: таблица различий

Параметрt-testz-test
Дисперсия известна?НетДа
Размер выборкиЛюбой, особенно малыйОбычно n > 30
Распределениеt-распределение (с df)Нормальное
Тяжёлые хвостыДа (при малых df)Нет
Сходится кZ при n → ∞
A/B тесты в продуктеЧаще всегоРедко

Когда использовать t-test

Когда использовать z-test

Ловушка на собесе

На собесе любят: «у нас выборка 100 000, какой тест?». Формально подойдёт z-test, но t-test даст почти тот же результат и безопаснее с точки зрения интервалов. В индустрии обычно везде t-test — он адаптируется автоматически.
Тренировать статистику в Telegram

Ещё сравнения по теме