Я використовую регрес на основі GAM, використовуючи gamlss пакет R та припускаючи, що бета-завищений бета-розподіл даних. У мене є тільки один пояснює змінної в моїй моделі, так це в основному: mymodel = gamlss(response ~ input, family=BEZI)
.
Алгоритм дає мені коефіцієнт для впливу пояснювальної змінної на середнє значення ( ) та пов'язане з ним p-значення для , приблизно так:
Mu link function: logit
Mu Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.58051 0.03766 -68.521 0.000e+00
input -0.09134 0.01683 -5.428 6.118e-08
Як ви бачите у наведеному вище прикладі, гіпотеза відкидається з високою впевненістю.
Потім я запускаю нульову модель: null = gamlss(response ~ 1, family=BEZI)
і порівнюю ймовірності, використовуючи тест коефіцієнта ймовірності:
p=1-pchisq(-2*(logLik(null)[1]-logLik(mymodel)[1]), df(mymodel)-df(null)).
У ряді випадків я отримую навіть тоді, коли коефіцієнти на вході є значущими (як вище). Я вважаю це досить незвичним - принаймні, ніколи не бувало в моєму досвіді з лінійною або логістичною регресією (насправді, цього також ніколи не бувало, коли я використовував нульову гаму з gamlss).
Моє запитання: чи можу я все-таки довіряти залежності між реакцією та входом, коли це так?