Залишкова діагностика в регресійних моделях на основі МСМС


21

Нещодавно я взявся за пристосування регресійних змішаних моделей у байєсівській основі, використовуючи алгоритм MCMC (фактично функція MCMCglmm в R).

Я вважаю, що я зрозумів, як діагностувати конвергенцію процесу оцінки (слід, графік гевеке, автокореляція, задній розподіл ...).

Одне з того, що мене вражає в байєсівських рамках, - це те, що, здається, приділяється багато зусиль для проведення цієї діагностики, тоді як, здається, робиться дуже мало з точки зору перевірки залишків відповідної моделі. Наприклад, у MCMCglmm функція ostaual.mcmc () існує, але насправді ще не реалізована (тобто .returns: "залишки ще не реалізовані для об'єктів MCMCglmm"; та сама історія для predict.mcmc ()). Здається, його не вистачає і в інших пакунках, і, як правило, мало обговорюється в літературі, яку я знайшов (окрім DIC, про який також досить сильно обговорюється).

Чи міг би хтось вказати на якісь корисні посилання, і в ідеалі R-код, з яким я міг би грати чи змінювати?

Велике дякую.


Чудове запитання. Мені дуже подобається , Ендрю Гельман папір з Cosma Шалізі про байєсівської перевірці моделі.
Девід Дж. Харріс

Відповіді:


7

Я думаю, що використання терміна залишковий не відповідає байєсівській регресії. Пам'ятайте, що у частолістських імовірнісних моделях параметри вважаються фіксованими оцінними величинами, а механізм генерування даних має деяку випадкову модель ймовірності, пов'язану із спостережуваними даними. Для байєсів параметри моделей ймовірності вважаються змінними, а фіксовані дані оновлюють нашу думку про те, що це за параметри. Тому, якщо ви обчислювали дисперсію спостережуваних мінус пристосованих значень у регресійній моделі, спостережуванеКомпонент матиме 0 дисперсію, тоді як пристосований компонент буде змінюватися залежно від задньої щільності ймовірності для параметрів моделі. Це протилежне тому, що ви випливали б із частістської регресійної моделі. Я думаю, якби хтось зацікавився у перевірці ймовірнісних припущень їхньої байєсівської регресійної моделі, простий QQplot задньої щільності оцінок параметрів (оцінюється з нашої вибірки MCMC) проти нормального розподілу мав би діагностичну потужність, аналогічну аналізу залишків (або залишків Пірсона для нелінійних функцій зв'язку).


1
Це хороша відповідь. Можливо, ще є відповіді, які дають корисні байєсові конструкції, обчислені із спостережуваного мінус-пристосованого залишку, але це, безумовно, не повинно було бути знято.
ely

3
Крім того, можливо, варто уточнити, що в байєсівській обстановці ви насправді не маєте "придатних" значень. Ви можете обчислити заднє середнє значення для даного спостережуваного входу, щоб отримати максимальну післяорієнтовану оцінку очікуваного значення цільової змінної на цьому вході. Але це зводить усе до точних оцінок, що зазвичай не бажано, якщо ви робите байєсівські умовиводи.
ely

2
@EMS будь-який із них є значущими залишками. Тільки тому, що людина баєса, це не означає, що не можна перевірити, чи припущення відображено в даних.
Glen_b -Встановіть Моніку

1
Для точного імовірнісного умовиводу (припущення про нормальність на місці) у частофілістській обстановці "залишки" в репліках дослідного експерименту були б умовно незалежними від "встановленого значення" (або умовного середнього значення). У світі Байєса дані не випадкові, то що було б умовно незалежним?
AdamO

1
Регресія в байєсівських та точних частолістських процедурах - це спосіб оцінки умовного середнього значення , що зазвичай описується набором параметрів моделі. Я використовую умовне середнє для позначення встановлених значень. У статистиці частотної є це поняття повторних експериментів, хоча ми розуміємо розміру і розподілу вибірки , як фіксуються в той час як є випадковим і при умови реплікації за допомогою повторних експериментів. Це частість тлумачення ймовірності. Ось чому залишки мають властивості випадкових змінних, зокрема функцію щільності. E[Y|X]XY
AdamO
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.