Навіщо використовувати бета-розподіл за параметром Бернуллі для ієрархічної логістичної регресії?


13

Зараз я читаю чудову книгу Крушке "Проведення байєсівського аналізу даних". Однак глава про ієрархічну логістичну регресію (глава 20) дещо заплутаний.

На рисунку 20.2 описана ієрархічна логістична регресія, де параметр Бернуллі визначений як лінійна функція на коефіцієнти, перетворені через сигмоподібну функцію. Це, мабуть, є ієрархічною логістичною регресією у більшості прикладів, які я бачив і в інших джерелах в Інтернеті. Наприклад - http://polisci2.ucsd.edu/cfariss/code/SIMlogit02.bug

Однак, коли предиктори номінальні, він додає шар в ієрархії - параметр Бернуллі тепер виводиться з бета-розподілу (мал. 20.5) з параметрами, визначеними mu і kappa, де mu - сигмоїдне перетворення лінійної функції коефіцієнтів , а kappa використовує гамму-попередник.

Це здається розумним і аналогічним прикладу перегортання монети з глави 9, але я не бачу, що стосується номінальних предикторів до додання бета-розподілу. Чому цього не зробили б у випадку метричних провісників і чому додано бета-розподіл для номінальних предикторів?

EDIT: Роз'яснення моделей, про які я маю на увазі. По-перше, логістична модель регресії з метричними предикторами (бета-версія раніше). Це схоже на інші приклади ієрархічної логістичної регресії, такі як приклад помилок вище:

yiBernoulli(μi)μi=sig(β0+jβjxji)β0N(M0,T0)βjN(Mβ,Tβ)

Тоді приклад з номінальними предикторами. Ось де я не зовсім розумію роль "нижчого" рівня ієрархії (включення логістичного результату до бета-версії до двочлена) і чому він повинен відрізнятися, ніж метричний приклад.

ziBin(θi,N)θiBeta(aj,bj)aj=μjκbj=(1μj)κκΓ(Sκ,Rκ)μj=sig(β0+jβjxji)β0N(M0,T0)βjN(0,τβ)τβ=1/σβ2σβ2folded t(Tt,DF)

Відповіді:


9

Дві моделі, які ви порівнюєте, мають багато сторонніх особливостей, і я думаю, ви можете чітко переробити своє запитання в контексті двох спрощених моделей:

Модель 1:

yi|μiBern(μi)μiπ(μi)

Модель 2:

yi|θiBern(θi)θi|μi,κBeta(μiκ,(1μi)κ)μiπ(μi)

Ваші запитання: (1) яку роль відіграє бета-розподіл; і пов'язане з цим (2) чим (якщо взагалі є) модель 2 відрізняється від моделі 1?

На поверхні вони виглядають досить різними моделями, але насправді граничні розподіли в обох моделях однакові. Задній розподіл в Моделі 1 є тоді як граничний задній розподіл в моделі 2 становить: μ iμiμi

p(μi|yi)μiyi(1μi)1yiπ(μi)
μi
p(μi|yi,κ)01θiyi+μiκ1(1θi)κ(1μi)yiB(κμi,κ(1μi))dθπ(μi)B(yi+μiκ,1yi+κ(1μi))π(μi)B(κμi,κ(1μi))μiyi(1μi)1yiπ(μi)

Таким чином, будь-яка перевага, отримана від використання моделі 2, є обчислювальною. Перепараметризація ієрархічних моделей, таких як додавання до моделі 2, іноді може підвищити ефективність процедури вибірки; наприклад, шляхом введення умовно сполучених зв'язків між групами параметрів (див. відповідь Джека Таннера) або шляхом порушення кореляції між параметрами, що цікавлять (google "Розширення параметрів").θi


5

Причиною виведення параметру Бернуллі з бета-розподілу є те, що бета є кон'югованою з двочленним. Використання попереднього розподілу кон'югату дає можливість вирішити закриту форму пошуку задньої частини.

EDIT: уточнення. Будь-яка модель буде працювати. Навіть із MCMC корисно мати споріднені пріори, оскільки це дозволяє використовувати спеціалізовані пробовідбірники для різних типів розподілів, які ефективніші, ніж загальні пробовідбірники. Наприклад, див. Посібник користувача JAGS сек. 4.1.1 та сек 4.2.


У моєму запитанні може не вистачити контексту з книги, але ці аналізи проводяться за допомогою вибірки Гіббса, тому представлення задньої форми задньої форми не потрібно. У прикладі, з яким я пов'язаний, параметр Бернуллі не фіксується як бета-розподіл, а виникає в результаті сигмоїдної трансформації лінійних предикторів, які мають нормально розподілені коефіцієнти. Ось так, як Крушке подає попередній приклад (з метричними предикторами) також у розділі (параметр Бернуллі - це лише сигмоїдне перетворення лінійної функції з нормально розподіленими коефіцієнтами)
user4733

@ user4733 Джек Таннер має рацію з приводу того, що бета є кон'югатом перед зразками Бернуллі. здається, більше, ніж збіг обставин, що його обрали. Так, ви можете робити вибірку Гіббса, щоб отримати задній розподіл, але в ієрархічній моделі є більше одного попереднього, і можливо, ви ставите пріоритет на гіперпараметр (параметр для сімейства попередніх розподілів. Це перед тим, якщо ви хочете. У цьому контексті може бути зручним використання попереднього кон'югату. Деякі ваші описи книги нас бентежать
Майкл Р. Черник

1
Ви берете невеликі уривки, які створюють прогалини в нашій здатності розуміти, що відбувається. Вам потрібно краще описати модель та ієрархію пріорів, щоб ми допомогли (принаймні для мене)>
Майкл Р. Черник

До ієрархічних моделей, які я маю на увазі, додано кілька описів. Сподіваємось, це допомагає.
користувач4733
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.