Нулевая и альтернативная гипотеза, p-value, уровень значимости, ошибки первого и второго рода — каркас статистического вывода. На собеседовании просят объяснить, что значит p-value = 0.03, можно ли «принять» нулевую гипотезу и в чём отличие одностороннего теста от двустороннего. Без этого блока остальная статистика не имеет смысла.
`power` показывает шанс правильно отвергнуть `H0`, когда `H1` верна (эффект реально существует). Поэтому `power` дополняет `beta` до 1: `power = 1 - beta`. Частая ошибка — думать, что `power` зависит только от `alpha`, игнорируя выборку и дисперсию.
Подробный разбор →`beta` описывает риск не обнаружить эффект, когда он действительно есть (то есть когда `H0` ложна). В бизнесе это часто означает «не выпустить полезную фичу», хотя она улучшает метрику. Типичная ошибка — путать `beta` с `alpha` и считать оба параметра «уровнями значимости».
Подробный разбор →Большой `p-value` означает, что данные не противоречат `H0` настолько, чтобы отвергнуть её при выбранном `alpha`. Но это может быть и следствием малого эффекта или недостаточной выборки, то есть высокого `beta` и низкого `power`. Частая ошибка — интерпретировать «нет значимости» как «эффекта нет».
Подробный разбор →При более высокой дисперсии стандартная ошибка оценки эффекта больше, и тесту сложнее отличить реальный эффект от случайных колебаний. Это повышает вероятность `beta` и снижает `power`. Практический вывод — иногда полезнее стабилизировать метрику или изменить дизайн, чем просто «ждать значимости».
Подробный разбор →При большой выборке даже очень маленький эффект может стать статистически значимым. Поэтому важно оценить размер эффекта, бизнес-ценность, риски внедрения и влияние на сегменты. Типичная ловушка — принимать решение только по `p-value`, игнорируя практическую значимость.
Подробный разбор →В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.
Тренировать статистику в Telegram