Якби хтось сказав
"Цей метод використовує MLE бальну оцінку для параметра, який максимізує , тому він є частосистемним; і далі він не баєсовский."
ти погодився б?
- Оновлення на задньому плані : нещодавно я прочитав статтю, яка стверджує, що вона часто. Я не згоден з їх твердженням, в кращому випадку я вважаю це неоднозначним. У цьому документі прямо не згадується ні MLE (ні MAP ). Вони просто беруть бальну оцінку, і вони просто діють так, як ніби ця бальна оцінка справжня. Вони цього не роблятьзробити будь-який аналіз розподілу вибірки цього оцінювача або щось подібне; модель досить складна, тому такий аналіз, мабуть, неможливий. Вони також не вживають слова "задній". Вони просто приймають цю бальну оцінку за номіналом і переходять до основної цікавої теми - виведення відсутніх даних. Я не думаю, що в їхньому підході є щось, що підказує, яка їх філософія. Вони, можливо, мали намір бути частоцистськими (бо відчувають себе зобов'язаними носити свою філософію на рукаві), але їх фактичний підхід досить простий / зручний / лінивий / неоднозначний. Зараз я схильний сказати, що дослідження насправді не має за собою філософії; натомість я думаю, що їхнє ставлення було більш прагматичним чи зручним:
"Я помітив дані, , і я хочу оцінити деякі відсутні дані, . Є параметр який контролює взаємозв'язок між і . Мені не дуже цікаво за винятком засобу для досягнення . Якщо у мене є оцінка для , це спростить передбачення з . Я виберу точну оцінку тому що це зручно, зокрема я виберу що максимально збільшує . "г & thetas ; г х & thetas ; & thetas ; г х & thetas ; & thetas ; Р ( х | & thetas ; )
У методах Байєса ролі даних і параметрів є певними зворотними. Зокрема, ми зараз визначаємо спостережувані дані та продовжуємо робити висновки про значення параметра. Це вимагає попереднього.
Поки що добре, але де MLE (Максимальна оцінка ймовірності) вписується у все це? У мене складається враження, що багато людей відчувають, що це частотант (а точніше, що це не баєс). Але я відчуваю, що це Байєс, тому що він включає взяття спостережуваних даних, а потім пошук параметра, який максимізує . MLE неявно використовує рівномірне попереднє та умовне використання даних та максимізацію . Чи справедливо сказати, що MLE виглядає як частолюдцем, так і баєсом? Або кожен простий інструмент повинен потрапити саме в одну з цих двох категорій?P ( p a r a m e t e r | d a t a )
MLE послідовний, але я вважаю, що послідовність може бути представлена як байєсівська ідея. Давши довільно великі вибірки, оцінка сходить на правильну відповідь. Заява "оцінка буде дорівнює справжньому значенню" має значення для всіх значень параметра. Цікавим є той факт, що ця заява також справедлива, якщо ви дотримуєтесь спостережуваних даних, роблячи її баєсівською. Цей цікавий бік стосується MLE, але не для об'єктивного оцінювача.
Ось чому я вважаю, що MLE - це «найбейсеєвіший» метод, який можна охарактеризувати як частотний.
У будь-якому випадку, більшість властивостей частота (наприклад, неупередженість) застосовуються у всіх випадках, включаючи кінцеві розміри вибірки. Той факт, що послідовність зберігається лише в неможливому сценарії (нескінченна вибірка в рамках одного експерименту), говорить про те, що послідовність не є такою корисною властивістю.
З огляду на реалістичний (тобто кінцевий) зразок, чи існує властивість Frequentist, що відповідає дійсності MLE? Якщо ні, то MLE насправді не часто.