R: нормальність тесту залишків лінійної моделі - які залишки використовувати


13

Я хотів би зробити W тест Шапіро Вілка і тест Колмогорова-Смірнова на залишки лінійної моделі, щоб перевірити їх нормальність. Мені було просто цікаво, які залишки слід використовувати для цього - залишки сировини, залишки Пірсона, залишки в студії або стандартизовані залишки? Для W тесту Shapiro-Wilk W виявляється, що результати для залишків & Pearson є однаковими, але не для інших.

fit=lm(mpg ~ 1 + hp + wt, data=mtcars)
res1=residuals(fit,type="response")
res2=residuals(fit,type="pearson")
res3=rstudent(fit)
res4=rstandard(fit)
shapiro.test(res1) # W = 0.9279, p-value = 0.03427
shapiro.test(res2) # W = 0.9279, p-value = 0.03427
shapiro.test(res3) # W = 0.9058, p-value = 0.008722
shapiro.test(res4) # W = 0.9205, p-value = 0.02143

Те саме питання щодо KS, а також чи слід перевіряти залишки на нормальний розподіл (pnorm), як у

ks.test(res1, "pnorm") # D = 0.296, p-value = 0.005563

або розподіл t-студента з nk-2 ступенями свободи, як у

ks.test(res3, "pt",df=nrow(mtcars)-2-2) 

Будь-яка порада, можливо? Крім того, які рекомендовані значення для тестової статистики W (> 0,9?) І D, щоб розподіл був достатньо близьким до нормальності і не впливав на ваш висновок занадто сильно?

Нарешті, чи враховує цей підхід невизначеність встановлених коефіцієнтів lm, чи функціонування cumres()в пакеті gof()було б кращим у цьому відношенні?

ура, Томе


9
Такий тест рідко має будь-який бал. Запитайте себе, які конкретні дії ви б вчинили, якби залишки виявилися "значно" ненормальними. Досвід вчить, що це залежить від того, як і наскільки вони відрізняються від нормальності. Жодне з них не вимірюється безпосередньо (або адекватно) за допомогою SW, KS або будь-якого іншого формального тесту на розподіл. Для цієї роботи ви хочете використовувати дослідницьку графіку, а не формальні тести. Питання про те, які залишки можуть бути придатними для побудови побудови, все ще стоїть, але решта питань, що залишилися, відпадають як сторонні.
whuber

Так, я помітив, що багато статистиків виступають за цю позицію. Але я все ж хотів би перевірити статистику тестів цих тестів (наприклад, перевірити, чи значення Shapiro Wilks W більше 0,9). І я завжди міг зробити трансформацію Box-Cox або щось подібне, щоб поліпшити нормальність у разі великих відхилень. Плюс моє запитання також було частково концептуальним - тобто, що було б найбільш правильним способом цього, навіть якщо нормальність не завжди є такою важливою на практиці ...
Том Венсельєр,

Відповіді:


9

Росла занадто довго для коментаря.

  1. Для звичайної регресійної моделі (такої, якою би підходив lm), немає різниці між першими двома залишковими типами, які ви розглядаєте; type="pearson"є актуальним для гауссових GLM, але є таким же, як і responseдля гауссових моделей.

  2. Спостереження, до яких ви застосовуєте тести (деякі форми залишків), не є незалежними, тому звичайна статистика не має правильного розподілу. Далі, строго кажучи, жоден із залишків, які ви вважаєте, не буде абсолютно нормальним, оскільки ваші дані ніколи не будуть абсолютно нормальними. [Формальне тестування відповідає на неправильне запитання - більш релевантним питанням буде "наскільки ця ненормальність вплине на мій висновок?"

  3. Навіть якби ваші дані були б абсолютно нормальними, ні третій, ні четвертий види залишків не були б абсолютно нормальними. Тим не менш, люди набагато частіше обстежують їх (скажімо, за допомогою QQ-сюжетів), ніж залишки сировини.

  4. Ви можете подолати деякі проблеми в 2. і 3. (залежність залишків, а також ненормальність у стандартизованих залишках) за допомогою моделювання, що залежить від вашої дизайнерської матриці ( ), тобто ви можете використовувати будь-які залишки, які вам подобаються (однак ви не можете мати справу з проблемою "відповісти на непосидне запитання, на яке ви вже знаєте відповідь").Х

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.