Распределение суммы покупок сильно скошено вправо: большинство чеков маленькие, но есть редкие крупные. Зачем аналитик применяет логарифмическое преобразование?

AСделать данные строго нормальными — после логарифма любое распределение становится симметричным
BСжать правый хвост и растянуть левый — уменьшить влияние крупных значений на анализ
CУвеличить дисперсию данных для повышения чувствительности статистических тестов
DПреобразовать отрицательные значения в положительные для корректного расчёта среднего
Правильный ответ. Логарифм сжимает большие значения сильнее малых, что уменьшает правую асимметрию и снижает влияние крупных выбросов на статистики.

Разбор

При правой асимметрии логарифм «подтягивает» правый хвост: разница между 100 и 1000 (×10) становится разницей между 2 и 3 (log₁₀). Это делает распределение ближе к симметричному — но не гарантирует нормальность. Логарифм не работает для нулей и отрицательных значений — используют log(x + 1) или другие преобразования. Увеличения дисперсии не происходит: наоборот, она уменьшается.

Проверь себя · 1/3разбор после ответа
Если ко всем значениям набора прибавить 5, как изменится mean?
Тренировать статистику в Telegram

Ещё вопросы по теме «Описательная статистика»