У вас есть p95 времени ответа по регионам и количество запросов в каждом регионе. Можно ли корректно получить общий p95 как взвешенное среднее региональных p95 с веса = запросы?

AНет: процентили не агрегируются через взвешенное среднее, нужен пересчёт на объединённых данных или доступ к распределению
BДа: достаточно сделать взвешенное среднее по числу запросов
CДа: можно взять простое среднее p95 по регионам
DДа: нужно взять максимальный p95 по регионам, это и будет общий p95
Правильный ответ. Процентили не агрегируются через взвешенное среднее; их нельзя корректно получить из одних только сегментных процентов и веса.

Разбор

p95 зависит от формы распределения, а не только от среднего значения сегмента. Два сегмента с одинаковым p95 могут иметь разные «хвосты», и при объединении общий p95 может измениться непредсказуемо. Чтобы получить p95 на нужном уровень агрегации, нужно пересчитать его на объединённой выборке или иметь доступ к распределению/сырым логам.

Проверь себя · 1/3разбор после ответа
ARPU за период вырос, но в разрезе iOS и Android ARPU снизился в каждом сегменте. Что корректнее всего сделать перед выводом о росте продукта?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Взвешенные средние и смешение»