Я хотів би зробити W тест Шапіро Вілка і тест Колмогорова-Смірнова на залишки лінійної моделі, щоб перевірити їх нормальність. Мені було просто цікаво, які залишки слід використовувати для цього - залишки сировини, залишки Пірсона, залишки в студії або стандартизовані залишки? Для W тесту Shapiro-Wilk W виявляється, що результати для залишків & Pearson є однаковими, але не для інших.
fit=lm(mpg ~ 1 + hp + wt, data=mtcars)
res1=residuals(fit,type="response")
res2=residuals(fit,type="pearson")
res3=rstudent(fit)
res4=rstandard(fit)
shapiro.test(res1) # W = 0.9279, p-value = 0.03427
shapiro.test(res2) # W = 0.9279, p-value = 0.03427
shapiro.test(res3) # W = 0.9058, p-value = 0.008722
shapiro.test(res4) # W = 0.9205, p-value = 0.02143
Те саме питання щодо KS, а також чи слід перевіряти залишки на нормальний розподіл (pnorm), як у
ks.test(res1, "pnorm") # D = 0.296, p-value = 0.005563
або розподіл t-студента з nk-2 ступенями свободи, як у
ks.test(res3, "pt",df=nrow(mtcars)-2-2)
Будь-яка порада, можливо? Крім того, які рекомендовані значення для тестової статистики W (> 0,9?) І D, щоб розподіл був достатньо близьким до нормальності і не впливав на ваш висновок занадто сильно?
Нарешті, чи враховує цей підхід невизначеність встановлених коефіцієнтів lm, чи функціонування cumres()
в пакеті gof()
було б кращим у цьому відношенні?
ура, Томе