Почему на практике MLE часто реализуют как максимизацию log L(θ) вместо L(θ)?

AПотому что логарифм меняет максимум на минимум, и так проще
BПотому что log делает любую оценку несмещённой
CПотому что log применим только к дискретным распределениям
DПотому что log монотонен (максимум сохраняется) и произведения превращаются в суммы, что численно стабильнее
Правильный ответ. log-likelihood сохраняет точку максимума и делает оптимизацию стабильнее и проще.

Разбор

Для независимых наблюдений likelihood часто равен произведению многих вероятностей, и числа быстро становятся слишком малыми для машинной арифметики. log превращает произведение в сумму и обычно делает градиенты удобнее. При этом точка максимума не меняется, потому что log монотонно возрастает. Ошибка — думать, что переход к log меняет саму точечную оценку MLE.

Проверь себя · 1/3разбор после ответа
Вы оцениваете вероятность конверсии p по выборке: из 100 пользователей 56 оплатили. Что является точечной оценкой параметра p?
Тренировать статистику в Telegram

Ещё вопросы по теме «Точечные оценки и MLE»