Распределение суммы покупок сильно скошено вправо: большинство чеков маленькие, но есть редкие крупные. Зачем аналитик применяет логарифмическое преобразование?
AСделать данные строго нормальными — после логарифма любое распределение становится симметричным
BСжать правый хвост и растянуть левый — уменьшить влияние крупных значений на анализ
CУвеличить дисперсию данных для повышения чувствительности статистических тестов
DПреобразовать отрицательные значения в положительные для корректного расчёта среднего
Правильный ответ. Логарифм сжимает большие значения сильнее малых, что уменьшает правую асимметрию и снижает влияние крупных выбросов на статистики.
Разбор
При правой асимметрии логарифм «подтягивает» правый хвост: разница между 100 и 1000 (×10) становится разницей между 2 и 3 (log₁₀). Это делает распределение ближе к симметричному — но не гарантирует нормальность. Логарифм не работает для нулей и отрицательных значений — используют log(x + 1) или другие преобразования. Увеличения дисперсии не происходит: наоборот, она уменьшается.
Проверь себя · 1/3разбор после ответа
Если ко всем значениям набора прибавить 5, как изменится
mean?Ещё вопросы по теме «Описательная статистика»
- Для набора значений 2, 4, 6, 8 чему равно `mean`?
- Даны значения 1, 3, 7, 9, 10. Чему равна `median`?
- Для набора 1, 2, 2, 3, 3, 3, 4 чему равна `mode`?
- В отчёте о зарплатах есть редкие очень большие значения (`выбросы`). Какую меру центра обычно лучше использовать вместо `mean`, чтобы не исказить картину?
- Как обычно называют `quantile` уровня 0.25?
- Все вопросы по «Описательная статистика» →