Аналитик хочет использовать 10%-усечённое среднее (trimmed mean) для метрики ARPU, чтобы снизить влияние выбросов. Как оно рассчитывается?

AОтбросить по 10% наименьших и наибольших значений и вычислить среднее по оставшимся 80%
BЗаменить все значения выше 90-го перцентиля на значение 90-го перцентиля перед расчётом
CВычислить среднее, а затем исключить все значения, отличающиеся от него более чем на 10%
DВзять медиану вместо среднего — это стандартный способ усечения при наличии выбросов
Правильный ответ. 10%-усечённое среднее отбрасывает по 10% наблюдений с каждого края распределения и считает обычное среднее по оставшимся 80%.

Разбор

Усечённое среднее — компромисс между средним (чувствительно к выбросам) и медианой (игнорирует величину значений). При 10%-усечении отсортированный ряд «обрезают» с обоих концов на 10% и считают среднее оставшихся. Это не то же самое, что винсоризация: при винсоризации крайние значения заменяются на граничные, а не удаляются. Замена выбросов на перцентиль — это именно винсоризация.

Проверь себя · 1/3разбор после ответа
Какая формула верно связывает variance и std?
Тренировать статистику в Telegram

Ещё вопросы по теме «Описательная статистика»