Распределение суммы покупок сильно скошено вправо: большинство чеков маленькие, но есть редкие крупные. Зачем аналитик применяет логарифмическое преобразование?

Question

Карьерник · Accepted Answer

Правильный ответ: Сжать правый хвост и растянуть левый — уменьшить влияние крупных значений на анализ. Логарифм сжимает большие значения сильнее малых, что уменьшает правую асимметрию и снижает влияние крупных выбросов на статистики. При правой асимметрии логарифм «подтягивает» правый хвост: разница между 100 и 1000 (×10) становится разницей между 2 и 3 (log₁₀). Это делает распределение ближе к симметричному — но не гарантирует нормальность. Логарифм не работает для нулей и отрицательных значений — используют log(x + 1) или другие преобразования. Увеличения дисперсии не происходит: наоборот, она уменьшается.

Распределение суммы покупок сильно скошено вправо: большинство чеков маленькие, но есть редкие крупные. Зачем аналитик применяет логарифмическое преобразование?

Разбор

Ещё вопросы по теме «Описательная статистика»