Мене плутає метод максимальної ймовірності порівняно з, наприклад, обчисленням середнього арифметичного.
Коли і чому максимальна ймовірність дає "кращі" оцінки, ніж, наприклад, середнє арифметичне? Як це можна перевірити?
Мене плутає метод максимальної ймовірності порівняно з, наприклад, обчисленням середнього арифметичного.
Коли і чому максимальна ймовірність дає "кращі" оцінки, ніж, наприклад, середнє арифметичне? Як це можна перевірити?
Відповіді:
Хоча середнє арифметичне може звучати як "природний" оцінювач, можна запитати, чому слід віддати перевагу MLE! Єдине впевнене властивість, пов'язане з середнім арифметичним, - це те, що це об'єктивний оцінювач E [ X ], коли це очікування визначено. (Поміркуйте про розподіл Коші як протилежний приклад.) Пізніше дійсно користується широким спектром властивостей в умовах регулярності на функції ймовірності. Для запозичення на сторінці вікіпедії є MLE
У порівнянні з середнім арифметичним, більшість цих властивостей задовольняються також для достатнього регулярного розподілу. За винятком 4 і 5. У випадку експоненціальних сімей MLE і середнє арифметичне є однаковими для оцінки параметра в середній параметризації (але не для інших параметрів). І MLE існує для вибірки з розподілу Коші.
Давайте інтерпретуємо "обчислення середнього арифметичного" як оцінку за допомогою Методу моментів (МО). Я вважаю, що це вірне початковому питанню, оскільки метод замінює вибіркові середні значення теоретичними. Він також стосується занепокоєння @ Xi'ana щодо довільного параметра (від довільної моделі).
Якщо ви все ще зі мною, то я думаю, що прекрасне місце - це приклади, де метод моментів може перемогти максимальну ймовірність у невеликих зразках? У тексті запитання вказується, що "Оцінки максимальної ймовірності (MLE) є асимптотично ефективними; ми бачимо практичний підсумок в тому, що вони часто роблять краще, ніж оцінка моментів (MoM) оцінок (коли вони відрізняються)", і шукає конкретні випадки, коли оцінювачі MoM досягти меншої середньої квадратичної помилки, ніж її аналог MLE. Кілька прикладів, які надаються, знаходяться в контексті лінійної регресії, двопараметричного зворотного гауссова розподілу та асиметричного експоненціального розподілу потужності.
Таке уявлення про "асимптотичну ефективність" означає, що оцінки максимальної ймовірності, ймовірно, близькі до використання даних з максимальним потенціалом (для оцінки відповідного параметра), це гарантія, яку ви не отримаєте з методу моментів загалом. Хоча максимальна ймовірність не завжди «краща», ніж робота з середніми показниками, ця властивість ефективності (якщо тільки в межах межі) робить її методом переходу до більшості лікарів. Звичайно, контрагент може стверджувати, що зі збільшенням розміру наборів даних, якщо ви вказуєте на потрібну ціль із функцією середніх значень, йдіть із нею.
Є кілька відомих прикладів, коли максимальна ймовірність (ML) не дає найкращого рішення. Дивіться доповідь Люсьєна Ле Кама 1990 року: "Максимальна ймовірність: вступ" [1] , що з його запрошених лекцій в Університеті. штату Меріленд.
Приклад, який мені найбільше подобається, тому що це просто, це такий:
Я не зіпсую задоволення, даючи вам відповідь, але (не дивно) є два способи вирішити це за допомогою ML, і вони дають різні рішення. Одне - «середнє арифметичне» залишків у квадраті (як можна було б очікувати), а друге - половина середнього арифметичного. Ви можете знайти відповідь тут на моїй сторінці Github.