Студизовані залишки v / s стандартизовані залишки в lm-моделі


10

Чи "студизовані залишки" та "стандартизовані залишки" однакові у регресійних моделях? Я побудував модель лінійної регресії в R і хотів побудувати графік встановлених значень Studentized залишків v / s, але не знайшов автоматизованого способу зробити це в Р.

Припустимо, у мене є модель

library(MASS)

lm.fit <- lm(Boston$medv~(Boston$lstat))

то використання plot(lm.fit)не дає будь-якої графіки Студентизованих залишків проти встановлених значень, але все ж надає графік стандартизованих залишків проти встановлених значень.

Я використав, plot(lm.fit$fitted.values,studres(lm.fit)і він побудує потрібний графік. Тому я просто хочу підтвердити, що я йду правильним шляхом, а «Засвідчені та стандартизовані залишки» - це не те саме. Якщо вони різні, будь ласка, надайте посібник для їх обчислення та їх визначення. Я пошукав мережу і виявив це трохи заплутаним.


2
+1 Це в оману , тому що (а) дійсно ці типи невязок відрізняються , але (б) різні органи влади не домовилися про те , що їх називають! Наприклад, Rтермінологія є протилежною Montgomery, Peck і Vining (популярний підручник з регресії, який існує вже 35 років). Тож будьте обережні та переконайтесь, що ви вивчаєте Rдокументацію та, якщо потрібно, її вихідний код, а не покладаєтесь на те, що, на вашу думку, означає термінологія.
whuber

Відповіді:


11

Ні, студизовані залишки та стандартизовані залишки - це різні (але пов'язані з ними) поняття.

R фактично забезпечує вбудовані функції rstandard()і rstudent()є частиною заходів впливу . Один і той же вбудований пакет забезпечує багато подібних функцій для важеля, відстані Кука тощо. По rstudent()суті такий же, як MASS::studres()і ви можете перевірити на себе так:

> all.equal(MASS::studres(model), rstudent(model))
[1] TRUE

Стандартизовані залишки - це спосіб оцінки помилки для певної точки даних, який враховує важіль / вплив точки. Їх іноді називають "внутрішньо студизованими залишками".

ri=eis(ei)=eiMSE(1hii)

Мотивація за стандартизованими залишками полягає в тому, що, хоча наша модель припускає гомоскедастичність із терміном помилки iid з фіксованою дисперсією , розподіл, залишки не можуть бути ідентичними, оскільки сума залишків завжди точно дорівнює нулю.ϵiN(0,σ2)ei

Вивчені залишки для будь-якої точки даних обчислюються від моделі, придатної до будь-якої іншої точки даних, крім тієї, про яку йдеться. Їх по-різному називають "залишковими залишками", "видаленими залишками" або "залишками, зафіксованими ножем".

Це звучить обчислювально важко (це здається, що нам доведеться підходити по одній новій моделі для кожної точки), але насправді є спосіб обчислити її лише з оригінальної моделі без поновлення. Якщо стандартизованим залишковим є , то студийований залишковий дорівнює:riti

ti=ri(nk2nk1ri2)1/2,

Мотивація, що стоїть за допомогою студенізованих залишків, випливає з їх використання в тестуванні зовнішніх робіт. Якщо ми підозрюємо, що точка є зовнішньою, то вона не була породжена з припущеної моделі, за визначенням. Тому було б помилкою - порушенням припущень - включити цю сторонність у підгонку моделі. Вивчені залишки широко використовуються в практичному виявленні зовнішньої форми.

Досліджені залишки також мають бажане властивість, що для кожної точки даних розподіл залишкової буде t-розподілом Стьюдента, припускаючи припущення щодо нормальності вихідної моделі регресії. (Стандартизовані залишки не мають такого приємного розподілу.)

Нарешті, для вирішення будь-яких проблем з приводу того, що бібліотека R може дотримуватися номенклатури, відмінної від вище, у документації на R чітко зазначено, що вони використовують "стандартизовані" та "студентизовані" в точно такому ж сенсі, як описано вище.

Функції rstandardта rstudentдати стандартизовані та Studentized залишки відповідно. (Ці повторно нормалізувати залишки , щоб мати одиничну дисперсію, використовуючи загальний та відпустку один-аут заходи дисперсії помилки відповідно.)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.