Среднее, медиана, мода, стандартное отклонение, квантили, IQR — базовые метрики для описания данных. На собеседовании спрашивают, когда медиана лучше среднего, как выбросы влияют на дисперсию и что показывает коэффициент вариации. Это фундамент, без которого невозможно анализировать данные.
Одинаковый `mean` не гарантирует одинаковый пользовательский опыт: при большой `variance` результаты сильнее колеблются. Это может быть нормально (например, сегменты очень разные), а может быть риском для бизнеса. Часто полезно дополнительно смотреть `std` и `quantile`, чтобы понимать хвосты. Ошибка — игнорировать разброс и принимать решение только по среднему.
`Variance` измеряет средний квадрат отклонения от центра, поэтому у неё 'квадратные' единицы. `Std` берёт корень и возвращает масштаб разброса в исходных единицах. Из-за этого `std` легче интерпретировать на практике. Ошибка — путать `variance` и `std` и сравнивать их напрямую как числа одного масштаба.
`Variance` и `std` сильно зависят от экстремальных значений, потому что используют квадраты отклонений. `Mean` вообще не мера разброса и тоже чувствителен к `выбросы`. `IQR` учитывает только Q1 и Q3, то есть центральные 50% данных, поэтому обычно устойчивее. Частая ошибка — сравнивать разброс по `std`, не замечая, что его раздувают единичные точки.
Разброс в исходных единицах растёт пропорционально масштабу данных. Если умножить каждое значение на 3, отклонения от центра тоже умножатся на 3, значит `std` станет в 3 раза больше. При этом `variance` увеличилась бы в 9 раз, потому что использует квадраты. Типичная ошибка — путать, как ведут себя `variance` и `std` при масштабировании.
При длинном хвосте редкие очень большие значения тянут `mean` вверх. `Median` устойчивее к таким значениям и ближе к тому, что испытывает большинство пользователей. Полезно дополнить картину `quantile` (например, 0.9), чтобы видеть хвост. Ошибка — трактовать рост `mean` как ухудшение для всех, когда проблема только в хвосте.
В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.
Тренировать в Telegram