Среднее, медиана, мода, стандартное отклонение, квантили, IQR — базовые метрики для описания данных. На собеседовании спрашивают, когда медиана лучше среднего, как выбросы влияют на дисперсию и что показывает коэффициент вариации. Это фундамент, без которого невозможно анализировать данные.
Размах показывает общий «разлёт» данных и вычисляется как max − min. В данном примере это 28 − 3 = 25. Его недостаток — полная зависимость от двух крайних точек: один выброс может кратно увеличить размах, не отражая реального разброса большинства наблюдений. Поэтому на практике чаще используют IQR или стандартное отклонение.
Складываем значения: 2 + 4 + 6 + 8 = 20. Делим на количество наблюдений 4 и получаем 5. Типичная ошибка — забыть разделить на количество элементов или перепутать с `median`.
При нечётном количестве значений медиана — центральный элемент после сортировки. Здесь список уже отсортирован, центральное значение — 7. Частая ошибка — выбирать среднее арифметическое вместо `median`.
В этом наборе число 3 встречается три раза, число 2 — два раза, остальные — по одному. Значит, `mode` равна 3. Ошибка новичков — думать, что `mode` всегда равна `median` или `mean`.
Сначала сортируют данные, затем находят два центральных значения. Медианой берут их среднее, чтобы получить точку, делящую данные примерно пополам. Это определение сохраняет смысл `median` как 'середины' распределения. Ошибка — выбирать одно из центральных значений произвольно.
В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.
Тренировать в Telegram