Мене звуть Х'ю, і я докторант, використовуючи узагальнені моделі добавок, щоб зробити деякий дослідницький аналіз.
Я не впевнений, як інтерпретувати значення p, що надходять із пакету MGCV, і хотів перевірити своє розуміння (я використовую версію 1.7-29 та ознайомився з деякою документацією Simon Wood). Спочатку я шукав інші питання з резюме, але, мабуть, найбільш відповідні стосуються загальних регресій, а не p-значень GAM зокрема.
Я знаю, що GAM має багато різних аргументів, і значення р є лише приблизними. Але я тільки починаю просте, щоб побачити, чи є якийсь "сигнал" для моїх товаришів. Наприклад:
Y ~ s (a, k = 3) + s (b, k = 3) + s (c, k = 3) + s (d, k = 3) + s (e, k = 3)
Орієнтовні p-значення гладких доданків:
s (a) = 0,000473
s (b) = 1,13e-05
s (c) = 0,000736
s (d) = 0,887579
s (e) = 0,234017
R ² (скориговано) = 0,62
Пояснення відхилення = 63,7% показника GCV = 411,17 Оцінка масштабу = 390,1 n = 120
Я вирізав колонки df тощо, завдяки форматуванню. Я інтерпретую значення р для кожного коваріату як тест на те, чи відповідна гладка функція значно зменшує відхилення моделі, де р - ймовірність отримання даних принаймні як «відносно неправдоподібних», ніж ті, що спостерігаються за нульовою моделлю 0.
Це означає, що (наприклад, з альфа = 0,05) згладжені функції не зменшують відхилення для "d" & "e" порівняно з нульовою моделлю, тоді як вони виконувались для інших термінів. Отже, (d) та (e) не додають суттєвої інформації до регресії, а пояснене відхилення зменшено до (a) (b) (c)?
Будь-яка порада буде дуже вдячна і найкраще пощастить у ваших дослідженнях.