Вопросы по теме «Точечные оценки и MLE»

Метод максимального правдоподобия (MLE), несмещённость, состоятельность, эффективность — свойства оценок, которые определяют их качество. На собеседовании просят вывести MLE для простого распределения или объяснить, почему выборочное среднее — хорошая оценка. Это теоретическая база, которая лежит под всеми статистическими тестами.

Всего в этом разделе 20 вопросов. Каждый — с правильным ответом и кратким разбором теории. Разбито на 4 части по 5 вопросов.

Хи-квадрат и таблицы сопряжённостиДоверительные интервалыКорреляция и регрессияОписательная статистикаОсновы проверки гипотезМножественные сравненияСлучайные величины и выборочные распределенияБутстреп и перестановочные тестыВыборка и смещениеТесты для среднихТесты для долей

Вопросы 15 из 20

1Что лучше всего отличает точечную оценку параметра от `confidence interval`?
AТочечная оценка — одно значение вроде `p_hat`, а `confidence interval` даёт диапазон возможных значений параметра при уровне `1-α`
BТочечная оценка обязательно использует `CDF`, а интервал — только `PMF`
C`Confidence interval` всегда точнее, чем точечная оценка, поэтому точечная не нужна
DЭто одно и то же, просто разные названия
Ответ: Точечная оценка даёт одно число, а `confidence interval` показывает неопределённость вокруг него.

Точечная оценка удобна для отчётов и сравнения вариантов, но она не говорит, насколько вы уверены в числе. Интервал добавляет контекст неопределённости и помогает не переинтерпретировать шум как эффект. Частая ошибка — делать сильные выводы, видя только `p_hat`, и не проверять, широкий ли `confidence interval`.

2Вы оцениваете вероятность конверсии `p` по выборке: из 100 пользователей 56 оплатили. Что является точечной оценкой параметра `p`?
A`p_hat = 56/100`
BИнтервал значений `p` от 0.46 до 0.66
CГрафик конверсии по дням
DОписание, что конверсия зависит от источника трафика
Ответ: Точечная оценка — это одно число, вычисленное из данных для приближения параметра.

Параметр `p` — неизвестная характеристика процесса, а `p_hat` — вычисленное по выборке число. Интервал и график описывают неопределённость или структуру данных, но это уже не точечная оценка параметра. Частая ошибка — смешивать точечную оценку и способы визуализации/описания вариативности.

3Вы измеряете время ответа и моделируете его как `Normal(μ,σ)` при известном `σ`. Какая точечная оценка `MLE` для `μ`?
AВыборочная медиана
B`μ_hat = x̄` (выборочное среднее)
CМаксимум выборки
DМинимум выборки
Ответ: В нормальной модели `MLE` для `μ` совпадает с выборочным средним `x̄`.

Если предпосылка нормальности верна, среднее лучше всего согласуется с формой распределения, и `likelihood` максимизируется именно на `x̄`. Это связывает знакомую статистику со смыслом `MLE`. Ошибка — считать, что `MLE` обязательно равен медиане или что выборочное среднее всегда плохо из-за выбросов, не проверяя данные.

4В формулировке `MLE` что считается фиксированным, а что подбирается при максимизации `likelihood`?
AФиксирован параметр, а данные подбираются под него
BФиксированы и данные, и параметр, максимизация не нужна
CНаблюдённые данные фиксированы, а параметр рассматривается как переменная аргумент `likelihood`
DНичего не фиксировано: и данные, и параметр одновременно оптимизируются
Ответ: В `MLE` данные фиксированы, а параметр — переменный аргумент функции `likelihood`.

Вероятность `P(X=x | θ)` — это функция от данных при фиксированном `θ`, а `likelihood` `L(θ | x)` — та же запись, но как функция от `θ` при фиксированном `x`. Это и позволяет 'подбирать' параметр, максимизируя правдоподобие. Частая ошибка — путать `L(θ | x)` с `P(θ | x)`, что уже относится к байесовскому подходу.

5Что означает свойство `несмещённость` для оценки `θ_hat` параметра `θ`?
AОценка всегда равна параметру: `θ_hat = θ` для любой выборки
BВ среднем оценка попадает в параметр: `E[θ_hat] = θ`
CОценка имеет минимальную `variance` среди всех возможных оценок
DОценка обязательно является `MLE`
Ответ: `Несмещённость` означает правильность в среднем: `E[θ_hat] = θ`.

Несмещённая оценка может сильно колебаться от выборки к выборке, то есть иметь большую `variance`. Смещение (`bias`) — это систематический сдвиг среднего значения оценки относительно параметра. Типичная ловушка — думать, что несмещённость гарантирует наилучший результат на одной конкретной выборке.

1234

Хотите тренировать интерактивно?

В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.

Тренировать в Telegram

Другие темы: Статистика

Хи-квадрат и таблицы сопряжённостиДоверительные интервалыКорреляция и регрессияОписательная статистикаОсновы проверки гипотезМножественные сравненияСлучайные величины и выборочные распределенияБутстреп и перестановочные тестыВыборка и смещениеТесты для среднихТесты для долей