Аналитик хочет использовать 10%-усечённое среднее (trimmed mean) для метрики ARPU, чтобы снизить влияние выбросов. Как оно рассчитывается?
AОтбросить по 10% наименьших и наибольших значений и вычислить среднее по оставшимся 80%
BЗаменить все значения выше 90-го перцентиля на значение 90-го перцентиля перед расчётом
CВычислить среднее, а затем исключить все значения, отличающиеся от него более чем на 10%
DВзять медиану вместо среднего — это стандартный способ усечения при наличии выбросов
Правильный ответ. 10%-усечённое среднее отбрасывает по 10% наблюдений с каждого края распределения и считает обычное среднее по оставшимся 80%.
Разбор
Усечённое среднее — компромисс между средним (чувствительно к выбросам) и медианой (игнорирует величину значений). При 10%-усечении отсортированный ряд «обрезают» с обоих концов на 10% и считают среднее оставшихся. Это не то же самое, что винсоризация: при винсоризации крайние значения заменяются на граничные, а не удаляются. Замена выбросов на перцентиль — это именно винсоризация.
Проверь себя · 1/3разбор после ответа
Какая формула верно связывает
variance и std?Ещё вопросы по теме «Описательная статистика»
- Для набора значений 2, 4, 6, 8 чему равно `mean`?
- Даны значения 1, 3, 7, 9, 10. Чему равна `median`?
- Для набора 1, 2, 2, 3, 3, 3, 4 чему равна `mode`?
- В отчёте о зарплатах есть редкие очень большие значения (`выбросы`). Какую меру центра обычно лучше использовать вместо `mean`, чтобы не исказить картину?
- Как обычно называют `quantile` уровня 0.25?
- Все вопросы по «Описательная статистика» →