Кроки, щоб з'ясувати задній розподіл, коли це може бути досить простим, щоб мати аналітичну форму?


12

Про це також запитали в обчислювальній науці.

Я намагаюся обчислити байєсівську оцінку деяких коефіцієнтів для авторегресії з 11 зразків даних: де - гауссова із середнім 0 та дисперсією Попередній розподіл на вектор - гауссовий із середнім та діагональною матрицею коваріації із діагональні записи, що дорівнює .

Yi=μ+αYi1+ϵi
ϵiσe2(μ,α)t(0,0)σp2

Виходячи з формули авторегресії, це означає, що розподіл точок даних ( ) нормальний із середнім та дисперсією . Таким чином, щільність для всіх точок даних спільно (якщо припустити незалежність, що добре для програми, про яку я пишу), буде:Yiμ+αYi1σe2(Y)

p(Y|(μ,α)t)=i=21112πσe2exp(YiμαYi1)22σe2.

За теоремою Байєса ми можемо взяти добуток вищевказаної щільності з попередньою щільністю, і тоді нам просто потрібна константа нормалізації. Моя думка полягає в тому, що це повинно бути гауссовим розподілом, тому ми можемо турбуватися про нормалізуючу константу наприкінці, а не про чітке обчислення її інтегралами над та .μα

Це частина, з якою я маю проблеми. Як я обчислюю множення попередньої щільності (яка є багатоваріантною) та цього продукту одновимірної щільності даних? Задня частина повинна мати чисто густину та , але я не бачу, як ви вийдете з такого виробу.μα

Будь-які вказівники дуже корисні, навіть якщо ви просто вкажете мене в правильному напрямку, і тоді мені потрібно піти і зробити безладну алгебру (це те, що я вже кілька разів намагався).

Як вихідний, ось форма чисельника з правила Байєса:

1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2].

Питання полягає в тому, як бачити, що це зводиться до гауссової щільності .(μ,α)t

Додано

Зрештою, це зводиться до наступної загальної проблеми. Якщо вам надано якийсь квадратичний вираз, такий як як ви переведете його в квадратичну форму для деякої матриці 2x2 ? Це досить просто в легких випадках, але який процес ви використовуєте для отримання середніх оцінок, і ?

Aμ2+Bμα+Cα2+Jμ+Kα+L
(μμ^,αα^)Q(μμ^,αα^)tQμ^α^

Зауважте, я спробував прямолінійний варіант розширення формули матриці, а потім намагався прирівняти коефіцієнти, як вище. Проблема, в моєму випадку, полягає в тому, що константа дорівнює нулю, і тоді я в кінцевому підсумку отримую три рівняння в двох невідомих, тому це недостатньо визначено для відповідності коефіцієнтів (навіть якщо я припускаю симетричну квадратичну матрицю форми).L


Моя відповідь на [це запитання] ( stats.stackexchange.com/questions/22852/… ) може бути корисною. Зауважте, що вам потрібно попереднє спостереження - ітерації зупиняються на цьому.
ймовірністьлогічний

Я не бачу, навіщо мені це потрібно в цьому випадку. Я повинен ставитися до часових інтервалів так, як вони умовно незалежні з огляду на спостереження. Зауважте, що добуток щільності суглоба якраз від . Я не думаю, що я повинен отримати послідовно оновлену формулу тут, лише єдину формулу для заднього . i=2..11p((μ,α)t|Y)
ely

"Багатоваріантність" у попередньому не суперечить "уніваріантним" у щільності даних, оскільки вони є щільністю у 's. p(α,μ)yi
Сіань

Відповіді:


7

Підказка, що була в моїй відповіді на попередню відповідь, полягає в тому, щоб подивитися на те, як я інтегрував параметри - тому що ви будете робити саме такі інтеграли тут. Ви запитуєте припускає відомі параметри дисперсії, тому вони є константами. Потрібно лише подивитися на залежність від чисельника. Щоб побачити це, зауважте, що ми можемо написати:α,μ

p(μ,α|Y)=p(μ,α)p(Y|μ,α)p(μ,α)p(Y|μ,α)dμdα
=1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2]1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2]dμdα

Зверніть увагу , як ми можемо витягти перший фактор з подвійного інтеграла на знаменнику, і він скасовується чисельником. Ми також можемо витягнути суму квадратів і він також скасує. Інтеграл, який нам залишився зараз (після розширення квадрата):1(2πσe2)52πσp2exp[12σe2i=211Yi2]

=exp[10μ2+α2i=110Yi22μi=211Yi2αi=211YiYi1+2μαi=110Yi2σe2μ22σp2α22σp2]exp[10μ2+α2i=110Yi22μi=211Yi2αi=211YiYi1+2μαi=110Yi2σe2μ22σp2α22σp2]dμdα

Тепер ми можемо використовувати загальний результат від звичайного pdf.

exp(az2+bzc)dz=πaexp(b24ac)
Це випливає із заповнення квадрата на та зазначення, що не залежить від . Зауважимо, що внутрішній інтеграл над має цю форму з і і . Зробивши цей інтеграл, ви побачите, що інтеграл, що залишився надaz2+bzczμa=102σe2+12σp2b=i=211Yiαi=110Yiσe2c=α2i=110Yi22αi=211YiYi12σe2+α22σp2αтакож є такою формою, тому ви можете використовувати цю формулу ще раз, з різними . Тоді ви маєте змогу записати свою задню частину у формі де - матрицяa,b,c12π|V|12exp[12(μμ^,αα^)V1(μμ^,αα^)T]V2×2

Дайте мені знати, якщо вам потрібно більше підказок.

оновлення

(зауважте: правильна формула, має бути замість )10μ2μ2

якщо ми подивимось на квадратичну форму, яку ви написали в оновленні, помітили, що є коефіцієнтів ( не має значення для заднього, оскільки ми завжди можемо додати будь-яку константу, яка скасується в знаменнику). У нас також є невідомих . Отже, це "добре поставлена" проблема, якщо рівняння лінійно незалежні. Якщо розширити квадратичний отримуємо:5L5μ^,α^,Q11,Q12=Q21,Q22(μμ^,αα^)Q(μμ^,αα^)t

Q11(μμ^)2+Q22(αα^)2+2Q12(μμ^)(αα^)
=Q11μ2+2Q21μα+Q22α2(2Q11μ^+2Q12α^)μ(2Q22α^+2Q12μ^)α+
+Q11μ^2+Q22α^2+2Q12μ^α^

Порівнюючи коефіцієнт другого порядку, ми отримуємо що говорить про те, як виглядає (зворотна) матриця коваріації. Крім того, ми маємо два трохи складніші рівняння для після підстановки . Вони можуть бути записані у матричній формі у вигляді:A=Q11,B=2Q12,C=Q22α^,μ^Q

(2ABB2C)(μ^α^)=(JK)

Таким чином, оцінки даються:

(μ^α^)=(2ABB2C)1(JK)=14ACB2(BK2JCBJ2KA)

Показано, що ми не маємо унікальних оцінок, якщо тільки . Тепер у нас є: 4ACB2

A=102σe2+12σp2B=i=110Yiσe2C=i=110Yi22σe2+12σp2J=i=211Yiσe2K=i=211YiYi1σe2

Зауважте, що якщо ми визначимо для і візьмемо обмеження то оцінки для задаються звичайними найменшими квадратами оцінка і де і . Отже, задні оцінки - це середньозважене значення між оцінками OLS та попередньою оцінкою .Xi=Yi1i=2,,11σp2μ,αα^=i=211(YiY¯)(XiX¯)i=211(XiX¯)2μ^=Y¯α^X¯Y¯=110i=211YiX¯=110i=211Xi=110i=110Yi(0,0)


Це не особливо корисно, оскільки я конкретно зазначив, що тут не має значення знаменник. Знаменник - це просто нормалізуюча константа, що буде очевидно, коли ви зменшите чисельник до гауссової форми. Тож хитрощі для оцінки інтегралів у знаменнику математично справді круті, але просто не потрібні для мого застосування. Єдине питання, яке мені потрібно вирішити, - це маніпулювання чисельником.
ely

Ця відповідь дає і чисельник, і знаменник. Чисельник демонструє належний многочлен другого ступеня в що призводить до нормальної квадратичної форми, як підкреслюється ймовірністю. (α,μ)
Сіань

@ems - обчисливши нормалізуючу константу, ви побудуєте потрібну квадратичну форму. він буде містити терміни, необхідні для складання квадрата
ймовірністьлогічного

Я не розумію, як це дає вам квадратичну форму. Я розробив два інтеграли в знаменнику за допомогою інтегральної ідентичності Гаусса, яку ви розмістили. Зрештою, я просто отримую величезну безладну константу. Здається, не існує ясного способу прийняти цю константу і перетворити її на щось, що визначає значення потужності 1/2, і т.д. середній вектор ' .. Про це я просив допомоги в оригінальному запитанні. (μ^,α^)t
ely

Дякую величезне за детальне доповнення. Я робив деякі нерозумні помилки, намагаючись зробити алгебру, щоб з'ясувати квадратичну форму. Ваші коментарі щодо відношення до оцінювача OLS також дуже цікаві та оцінені. Я думаю, що це пришвидшить мій код, оскільки я зможу малювати зразки з аналітичної форми, яка має вбудовані, оптимізовані методи. Мій початковий план полягав у тому, щоб використовувати Метрополіс-Гастінгс для вибору цього, але це було дуже повільно. Дякую!
ely
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.