У вас миллион наблюдений, Pearson r между двумя метриками равен 0.03, а p-value очень маленький. Какой вывод наиболее корректен для продукта?
AСвязь сильная, потому что
p-value маленькийBСвязь статистически различима, но по размеру эффекта очень слабая; нужно оценивать практическую значимость
CЭто доказывает причинность, потому что данных много
DНужно перейти на
Geometric(p), потому что Pearson r не подходитПравильный ответ.
p-value отвечает про обнаружимость, а не про размер эффекта.Разбор
При большом объеме данных даже очень слабая correlation может быть статистически значимой. Для продуктовых решений важнее оценить эффект по масштабу и влиянию на метрики, а не только по p-value. Типичная ловушка — принять 'значимо' за 'важно' и переоценить влияние связи.
Проверь себя · 1/3разбор после ответа
У вас 100 наблюдений, где почти нет связи между
x и y, но есть одна точка с очень большим x и y. После добавления этой точки Pearson r стал 0.8. Что это чаще всего означает?Ещё вопросы по теме «Корреляция и регрессия»
- В отчете нашли положительную `correlation` между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
- В данных по товарам `Pearson r` между ценой и конверсией равен -0.7. Как это интерпретировать?
- У вас 100 наблюдений, где почти нет связи между `x` и `y`, но есть одна точка с очень большим `x` и `y`. После добавления этой точки `Pearson r` стал 0.8. Что это чаще всего означает?
- Конверсия растет со скидкой до порога, а затем почти не меняется. При этом `Pearson r` между скидкой и конверсией близок к 0. Какой вывод корректен?
- Вы видите положительную `correlation` между продажами мороженого и количеством утоплений по дням. Это типичный пример спуриозной (`spurious`) связи. Что наиболее вероятно объясняет наблюдение?
- Все вопросы по «Корреляция и регрессия» →