Ні, студизовані залишки та стандартизовані залишки - це різні (але пов'язані з ними) поняття.
R фактично забезпечує вбудовані функції rstandard()
і rstudent()
є частиною заходів впливу . Один і той же вбудований пакет забезпечує багато подібних функцій для важеля, відстані Кука тощо. По rstudent()
суті такий же, як MASS::studres()
і ви можете перевірити на себе так:
> all.equal(MASS::studres(model), rstudent(model))
[1] TRUE
Стандартизовані залишки - це спосіб оцінки помилки для певної точки даних, який враховує важіль / вплив точки. Їх іноді називають "внутрішньо студизованими залишками".
ri=eis(ei)=eiMSE(1−hii)−−−−−−−−−−−√
Мотивація за стандартизованими залишками полягає в тому, що, хоча наша модель припускає гомоскедастичність із терміном помилки iid з фіксованою дисперсією , розподіл, залишки не можуть бути ідентичними, оскільки сума залишків завжди точно дорівнює нулю.ϵi∼N(0,σ2)ei
Вивчені залишки для будь-якої точки даних обчислюються від моделі, придатної до будь-якої іншої точки даних, крім тієї, про яку йдеться. Їх по-різному називають "залишковими залишками", "видаленими залишками" або "залишками, зафіксованими ножем".
Це звучить обчислювально важко (це здається, що нам доведеться підходити по одній новій моделі для кожної точки), але насправді є спосіб обчислити її лише з оригінальної моделі без поновлення. Якщо стандартизованим залишковим є , то студийований залишковий дорівнює:riti
ti=ri(n−k−2n−k−1−r2i)1/2,
Мотивація, що стоїть за допомогою студенізованих залишків, випливає з їх використання в тестуванні зовнішніх робіт. Якщо ми підозрюємо, що точка є зовнішньою, то вона не була породжена з припущеної моделі, за визначенням. Тому було б помилкою - порушенням припущень - включити цю сторонність у підгонку моделі. Вивчені залишки широко використовуються в практичному виявленні зовнішньої форми.
Досліджені залишки також мають бажане властивість, що для кожної точки даних розподіл залишкової буде t-розподілом Стьюдента, припускаючи припущення щодо нормальності вихідної моделі регресії. (Стандартизовані залишки не мають такого приємного розподілу.)
Нарешті, для вирішення будь-яких проблем з приводу того, що бібліотека R може дотримуватися номенклатури, відмінної від вище, у документації на R чітко зазначено, що вони використовують "стандартизовані" та "студентизовані" в точно такому ж сенсі, як описано вище.
Функції rstandard
та rstudent
дати стандартизовані та Studentized залишки відповідно. (Ці повторно нормалізувати залишки , щоб мати одиничну дисперсію, використовуючи загальний та відпустку один-аут заходи дисперсії помилки відповідно.)
R
термінологія є протилежною Montgomery, Peck і Vining (популярний підручник з регресії, який існує вже 35 років). Тож будьте обережні та переконайтесь, що ви вивчаєтеR
документацію та, якщо потрібно, її вихідний код, а не покладаєтесь на те, що, на вашу думку, означає термінологія.