Як інтерпретувати P-значення GAM?

Мене звуть Х'ю, і я докторант, використовуючи узагальнені моделі добавок, щоб зробити деякий дослідницький аналіз.

Я не впевнений, як інтерпретувати значення p, що надходять із пакету MGCV, і хотів перевірити своє розуміння (я використовую версію 1.7-29 та ознайомився з деякою документацією Simon Wood). Спочатку я шукав інші питання з резюме, але, мабуть, найбільш відповідні стосуються загальних регресій, а не p-значень GAM зокрема.

Я знаю, що GAM має багато різних аргументів, і значення р є лише приблизними. Але я тільки починаю просте, щоб побачити, чи є якийсь "сигнал" для моїх товаришів. Наприклад:

Y ~ s (a, k = 3) + s (b, k = 3) + s (c, k = 3) + s (d, k = 3) + s (e, k = 3)

Орієнтовні p-значення гладких доданків:

s (a) = 0,000473
s (b) = 1,13e-05
s (c) = 0,000736
s (d) = 0,887579
s (e) = 0,234017

R ² (скориговано) = 0,62 $\quad$
Пояснення відхилення = 63,7% показника GCV = 411,17 $\quad$ Оцінка масштабу = 390,1 $\quad$ n = 120

Я вирізав колонки df тощо, завдяки форматуванню. Я інтерпретую значення р для кожного коваріату як тест на те, чи відповідна гладка функція значно зменшує відхилення моделі, де р - ймовірність отримання даних принаймні як «відносно неправдоподібних», ніж ті, що спостерігаються за нульовою моделлю 0.

Це означає, що (наприклад, з альфа = 0,05) згладжені функції не зменшують відхилення для "d" & "e" порівняно з нульовою моделлю, тоді як вони виконувались для інших термінів. Отже, (d) та (e) не додають суттєвої інформації до регресії, а пояснене відхилення зменшено до (a) (b) (c)?

Будь-яка порада буде дуже вдячна і найкраще пощастить у ваших дослідженнях.

p-value mgcv

— user45178
джерело

Документ з описом , як вони працюють тут .

Вони є р-значеннями, пов'язаними з тестами Уолда, що вся функція s (.) = 0. Низькі значення p вказують на низьку ймовірність того, що сплайни, що складають функцію, дорівнюють нулю.

Складне в них полягає в тому, що вони включають псевдоінверсію зниженого рангу. Типовий тест Вальда є $\hat f (V_\beta)^{-1} \hat f$ . Ви можете відразу побачити, що це t-тест у універсальному випадку (тобто, не матриці, а бета та дисперсія). Це дає дуже низьку потужність у випадку пеналізованих сплайнів, оскільки ці коефіцієнти штрафуються. Для цього пояснюється псевдоінверсія. Папір справді досить щільна, але як тільки ви отримаєте загальну суть - покращення потужності тесту шляхом обліку EDF замість матричного рангу - стає можливим слідувати формалізму.

— generic_user
джерело