Який краще максимальна ймовірність чи гранична ймовірність і чому?


13

Виконуючи регресію, якщо йти за визначенням: Яка різниця між частковою ймовірністю, профільною ймовірністю та граничною ймовірністю?

що, Максимальна ймовірність
Знайти β і θ, що максимізує L (β, θ | дані).

Тоді як гранична ймовірність
ми інтегруємо θ з рівняння ймовірності, використовуючи той факт, що ми можемо ідентифікувати розподіл ймовірності θ, умовного на β.

Яка краща методика максимізації та чому?

Відповіді:


14

Кожен із них дасть різні результати з різною інтерпретацією. Перший знаходить пару , яка найбільш вірогідна, а друга знаходить яка (незначно) найбільш вірогідна. Уявіть, що ваш розподіл виглядає так:θ ββθβ

    β=1β=2
θ=10.0 0.2 
θ=20.1 0.2 
θ=30.3 0.2 

Тоді максимальна відповідь на ймовірність - ( ), тоді як максимальна гранична ймовірність відповіді - (оскільки, маргіналізація над , ).θ = 3 β = 2 θ P ( β = 2 ) = 0,6β=1θ=3β=2θP(β=2)=0.6

Я б сказав, що загалом гранична ймовірність часто є тим, що ви хочете - якщо ви дійсно не піклуєтесь про значення параметрів , то вам слід просто обвалитися над ними. Але, ймовірно, на практиці ці методи не дадуть дуже різних результатів - якщо вони є, то це може вказувати на деяку основну нестабільність у вашому рішенні, наприклад, на кілька режимів з різними комбінаціями , які всі дають подібні прогнози.β θθβθ


Я знайшов різні результати для методів максимальної / граничної ймовірності, і отже, питання. Я б сказав, що два мої результати дають різні інтерпретації, але можливі результати.
Анкіт Чіплункар

5

Я зараз сам стикаюся з цим питанням. Ось результат, який може бути корисним. Розглянемо лінійну модель

y=Xβ+ϵ,ϵN(0,σ2)

де а β і σ 2 - цікаві параметри. Спільна ймовірність такаyRn,βRp,βσ2

L(β,σ2)=(2πσ2)n/2exp(||yXβ||22σ2)

Оптимізація прибутковості імовірності суглобів

β^=X+y

σ^2=1n||r||2

де являє собою псевдообернених X і г = у - Х β є необхідною залишковий вектор. Відзначимо , що в σ 2 ми маємо 1 / п замість звичних ступенями свободи коригується співвідношення 1 / ( п - р ) . Як відомо, цей оцінювач є упередженим у випадку з кінцевим зразком.X+Xr=yXβ^σ^21/n1/(np)

βσ2βσ2

σ^2=maxσ2RpL(β,σ2)dβ

Використовуючи елементарну лінійну алгебру та інтегральну формулу Гаусса, ви можете це показати

σ^2=1np||r||2

Це має виправлення ступенів свободи, що робить його неупередженим і загалом прихильним до спільної оцінки ПЗ.

З цього результату можна запитати, чи є щось по суті вигідне в інтегральній ймовірності, але я не знаю жодних загальних результатів, які б відповіли на це питання. Думається, що інтегрована ПН краще враховувати невизначеність у більшості проблем з оцінкою. Зокрема, якщо ви оцінюєте величину, яка залежить від інших оцінок параметрів (навіть неявно), то інтеграція за іншими параметрами краще враховуватиме їх невизначеність.


1
β

1
ββ

Насправді, виходячи з цього повідомлення та коментарів до нього, я думаю, що інтегрований ML, а не граничний ML - це правильний термін для того, що ми тут робимо. Відредаговано відповідно.
Павло

1
+1 Я знаю, що я запізнююся з цією партією, але не інтегрую з фіксованих ефектів, поставивши перед ними неправильну уніформу саме те, що робить REML, тому ви фактично тільки отримали оцінку REML, і ця корекція df - саме та чому тут REML краще для менших зразків?
jld

@Chaconne так, цей пост був мотивований спробою зрозуміти REML! У мене (майже) немає офіційної освіти з статистики, тому виведення цього було для мене все новим.
Пол

4

ββθθθθθip(θi)θdataβ

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.