Question 1

Что верно про связь свойств `несмещённость` и `состоятельность`?

Accepted Answer

`Несмещённость` отвечает про `E[θ_hat]`, а `состоятельность` — про поведение при росте `n`. Несмещённость — это 'правильность в среднем' на фиксированном размере выборки: `E[θ_hat]=θ`. Состоятельность означает, что при больших `n` оценка приближается к `θ`, даже если на малых выборках есть смещение. Поэтому ни одно из этих свойств не гарантирует другое автоматически. Ошибка — считать, что достаточно добиться несмещённости, и вопрос качества оценки закрыт.

Question 2

Время ожидания моделируется как `Exponential(λ)`. По выборке среднее время ожидания равно 5 секунд. Какая точечная оценка `MLE` для `λ`?

Accepted Answer

Для `Exponential(λ)` `MLE` для `λ` выражается как `λ_hat = 1 / x̄`. Параметр `λ` отвечает за скорость наступления события: чем он больше, тем меньше типичное время ожидания. Поэтому логично, что оценка `λ` обратно связана с наблюдаемым средним `x̄`. Частая ошибка — перепутать параметр `λ` и `mean` и подставить среднее напрямую. Также важно помнить про единицы времени: `λ` измеряется как 1/время.

Question 3

Почему на практике `MLE` часто реализуют как максимизацию `log L(θ)` вместо `L(θ)`?

Accepted Answer

`log-likelihood` сохраняет точку максимума и делает оптимизацию стабильнее и проще. Для независимых наблюдений `likelihood` часто равен произведению многих вероятностей, и числа быстро становятся слишком малыми для машинной арифметики. `log` превращает произведение в сумму и обычно делает градиенты удобнее. При этом точка максимума не меняется, потому что `log` монотонно возрастает. Ошибка — думать, что переход к `log` меняет саму точечную оценку `MLE`.

Question 4

Есть две оценки одного параметра: `θ_hat_A` несмещённая, но с высокой `variance`; `θ_hat_B` слегка смещённая, но с низкой `variance`. По какому критерию можно оправданно выбрать `θ_hat_B` как более полезную точечную оценку?

Accepted Answer

Компромисс `bias` и `variance` удобно сравнивать через `MSE = bias^2 + variance`. Несмещённость не гарантирует меньшую ошибку на практике, если оценка очень шумная. `MSE` учитывает и систематический сдвиг (`bias`), и разброс (`variance`), поэтому подходит для выбора между оценками. Типичная ошибка — выбирать оценку только потому, что она несмещённая, игнорируя нестабильность результата.

Question 5

Какие свойства часто (при обычных условиях) проявляет `MLE` при увеличении размера выборки?

Accepted Answer

При больших данных `MLE` часто ведёт себя хорошо: становится состоятельной и близкой к эффективной оценке. Во многих регулярных задачах `MLE` приближается к истинному параметру при росте `n` и становится более стабильной. Это связано с идеей, что при больших выборках `MLE` использует доступную информацию почти оптимально, то есть повышается эффективность (интуитивно). Однако на малых выборках `MLE` может быть смещённой и чувствительной к выбросам или неверной модели. Ошибка — ожидать от `MLE` гарантированных свойств без проверки предпосылок.

Точечные оценки и MLE: вопросы для собеседования (часть 3)

Вопросы 11–15 из 20

Хотите тренировать интерактивно?

Другие темы: Статистика