Що таке залишкова стандартна помилка?


35

Під час запуску моделі множинної регресії в R один з виходів є залишковою стандартною помилкою 0,0589 на 95,161 градуса свободи. Я знаю, що 95 161 градус свободи задається різницею між кількістю спостережень у моїй вибірці та кількістю змінних у моїй моделі. Що таке залишкова стандартна помилка?


2
Це питання та його відповіді можуть допомогти: Чому ми говоримо про залишкову стандартну помилку?
Антуан Вернет

Швидке запитання: Чи "залишкова стандартна помилка" збігається з "залишковим стандартним відхиленням"? Гельман і Хілл (с.41, 2007), схоже, використовують їх взаємозамінно.
JetLag

Відповіді:


26

Пристосована модель регресії використовує параметри для генерування прогнозування точок оцінки, які є засобом спостережуваних відповідей, якщо ви повинні нескінченно багато разів повторювати дослідження з тими ж значеннями (і коли лінійна модель відповідає дійсності). Різниця між цими передбачуваними значеннями та тими, які використовуються для підгонки до моделі, називаються "залишками", які при реплікації процесу збору даних мають властивості випадкових змінних із значенням 0.X

Спостережувані залишки потім використовуються для подальшої оцінки мінливості цих значень та для оцінки розподілу вибірки параметрів. Якщо залишкова стандартна похибка становить рівно 0, то модель ідеально підходить до даних (можливо, через перевиконання). Якщо не може бути показано, що залишкова стандартна помилка суттєво відрізняється від мінливості безумовної відповіді, то є мало свідчень, які дозволяють припустити, що лінійна модель має будь-яку здатність прогнозування.


3
На це, можливо, відповідали і раніше. Подивіться, чи надає це запитання потрібні відповіді. [Інтерпретація виходу lm () R [1] [1]: stats.stackexchange.com/questions/5135/…
подр. Номер

26

Скажімо, у нас є така таблиця ANOVA (адаптована з example(aov)команди R ):

          Df Sum Sq Mean Sq F value Pr(>F)
Model      1   37.0   37.00   0.483  0.525
Residuals  4  306.3   76.57               

Якщо розділити суму квадратів від будь-якого джерела варіації (модель чи залишки) на відповідні ступені свободи, ви отримаєте середній квадрат. Зокрема для залишків:

306.34=76.57576.57

Отже 76,57 - середній квадрат залишків, тобто кількість залишкової (після застосування моделі) змінної вашої змінної відповіді.

76.57


1
Я відповів голосом від @AdamO, тому що як людина, яка найчастіше використовує регресію, ця відповідь була для мене найпростішою. Однак я ціную цю відповідь, оскільки вона ілюструє нотаційну / концептуальну / методологічну залежність між ANOVA та лінійною регресією.
svannoy

12

Y=β0+β1X+ϵ
ϵX

β0β1ϵϵ

RSE пояснюється досить чітко у "Вступі до статистичного навчання".


2
ϵRSE=RSS(n2)

1
Для всіх, хто читає epub ISL, ви можете знайти "сторінку 66" за допомогою ctrl-f "залишкової стандартної помилки". (Файли Epub не мають правдивих номерів сторінок).
користувач2426679
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.