Інтервал довіри для моделі GAM


14

mgcv::gamДовідкова сторінка читання :

довірчі / достовірні інтервали легко доступні для будь-якої кількості, передбаченої за допомогою встановленої моделі

Однак я не можу зрозуміти, як реально його отримати. Я думав , що predict.gamбуде мати type=confidenceі з levelпараметром , але це не так. Чи можете ви допомогти мені, як це створити?

Відповіді:


33

Зазвичай:

p <- predict(mod, newdata, type = "link", se.fit = TRUE)

Потім зауважте, що pмістить компонент $se.fitзі стандартними помилками прогнозів для спостережень у newdata. Потім можна сформувати CI, помноживши SE на значення, відповідне бажаному рівню. Наприклад, приблизний 95% довірчий інтервал формується як:

upr <- p$fit + (2 * p$se.fit)
lwr <- p$fit - (2 * p$se.fit)

т

Зауважте, що я використовую, type = "link"як ви не говорите, якщо у вас GAM або просто AM. У GAM потрібно сформувати довірчий інтервал на шкалі лінійного прогноктора, а потім перетворити його на масштаб відповіді, застосувавши зворотну функцію зв'язку:

upr <- mod$family$linkinv(upr)
lwr <- mod$family$linkinv(lwr)

Тепер зауважимо, що це дуже приблизні інтервали. Крім того, ці інтервали орієнтуються на передбачувані значення, і вони не враховують того факту, що було здійснено вибір гладкості.

Одночасний довірчий інтервал можна обчислити за допомогою моделювання із заднього розподілу параметрів. Я маю приклад цього у своєму блозі .

Якщо ви хочете довірчий інтервал, який не обумовлений параметрами згладжування (тобто таким, який враховує, що ми не знаємо, а замість цього оцінюємо значення параметрів гладкості), тоді додайте unconditional = TRUE до predict()виклику.

Крім того, якщо ви не хочете цього робити самостійно, зауважте, що новіші версії mgcv мають plot.gam()функцію, яка повертає об'єкт із усіма даними, що використовуються для створення графіків гладких та їх довірчих інтервалів. Ви можете просто зберегти висновок з plot.gam()в obj

obj <- plot(model, ....)

а потім перевірте obj, що представляє собою список з одним компонентом на гладку. Додайте seWithMean = TRUEдо plot()виклику, щоб отримати довірчі інтервали, які не обумовлені параметром гладкості.


Виконуючи одночасний CI та параметричний завантажувальний пристрій, трохи більше залучайте до коду, тож, якщо вам вдасться пройти лише великі точкові інтервали. Якщо ні, то я можу навести подальші приклади для кожного з них.
Відновіть Моніку - Г. Сімпсон

+1 для відповіді. Вражаюча публікація в блозі, я справді буду її вивчати, щоб вдосконалити свої графічні навички.
jbowman

Будь-яким способом я міг отримати доступ до цієї вражаючої публікації в блозі ( ucfagls.wordpress.com/2011/06/12/… )? В даний час для блогу потрібен логін.
генеорама

@geneorama Я перенесла свій блог від Wordpress і протягом року платила за переадресацію на новий за всіма URL-адресами, але нещодавно я пропустила це. Вибач за це. Я відредагував нове посилання, і це не потребує входу. (Увійдіть, щоб уникнути двох копій одного і того ж допису, і я занадто лінивий, щоб видалити сторінки з сайту Wordpress досі.)
Відновіть Моніку - Г. Сімпсон,

Оригінальна публікація в блозі (див. Історію редагування цього запитання) мала принциповий недолік у створенні одночасного інтервалу. Посилання в поточній (станом на грудень 2016 р.) Версії відповіді правильно обчислює одночасний інтервал.
Відновіть Моніку - Г. Сімпсон

5

Якщо ви просто хочете побудувати їх, plot.gamфункція має затінення, яке за замовчуванням відповідає довірчим інтервалам за допомогою аргументу відтінку. Також дивіться gam.vcompдля отримання інтервалів.


5

Пакет mgcv(новіший, ніж гейм) легко розміщує достовірні інтервали. Цей байєсівський підхід відрізняється від довірчих інтервалів, але результати майже такі ж, як показали чисельні моделювання (див. Статтю Марри та Вуда, зв'язану в мгцв).


2
+1 Ключовим результатом роботи Marra & Wood є те, що вони розвивають розуміння / пояснення Нічка, чому достовірні інтервали емпіричного Байєса також мають досить надзвичайну часто- частотну інтерпретацію / поведінку, коли їх розглядають як довірчі інтервали довіри. Ви можете ставитися до інтервалів байєсівським або частолістським способом та властивістю покриття, що мається на увазі1-αінтервал утримується, приблизно.
Відновіть Моніку - Г. Сімпсон
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.