У вас миллион наблюдений, Pearson r между двумя метриками равен 0.03, а p-value очень маленький. Какой вывод наиболее корректен для продукта?

AСвязь сильная, потому что p-value маленький
BСвязь статистически различима, но по размеру эффекта очень слабая; нужно оценивать практическую значимость
CЭто доказывает причинность, потому что данных много
DНужно перейти на Geometric(p), потому что Pearson r не подходит
Правильный ответ. p-value отвечает про обнаружимость, а не про размер эффекта.

Разбор

При большом объеме данных даже очень слабая correlation может быть статистически значимой. Для продуктовых решений важнее оценить эффект по масштабу и влиянию на метрики, а не только по p-value. Типичная ловушка — принять 'значимо' за 'важно' и переоценить влияние связи.

Проверь себя · 1/3разбор после ответа
У вас 100 наблюдений, где почти нет связи между x и y, но есть одна точка с очень большим x и y. После добавления этой точки Pearson r стал 0.8. Что это чаще всего означает?
Тренировать статистику в Telegram

Ещё вопросы по теме «Корреляция и регрессия»