Інтерпретація залишкового та нульового відхилення в GLM R


47

Як інтерпретувати нульове та залишкове відхилення в GLM в R? Мовляв, ми говоримо, що менший AIC кращий. Чи є подібне і швидке тлумачення відхилень?

Нульове відхилення: 1146,1 на 1077 градусів свободи Залишкове відхилення: 4589,4 на 1099 градусів свободи AIC: 11089

Відповіді:


74

Нехай LL = логічність

Ось короткий підсумок того, що ви бачите з результатів підсумків (glm.fit),

Нульове відхилення = 2 (LL (насичена модель) - LL (нульова модель)) на df = df_Sat - df_Null

Залишковий відхилення = 2 (LL (насичена модель) - LL (пропонована модель)) df = df_Sat - df_Proposed

Насичена Модель являє собою модель , яка передбачає , кожну точку даних має свої власні параметри (що означає , що ви установках для оцінки.)

Null модель передбачає точні «зворотний», в який приймає один параметр для всіх точок даних, що означає , що ви тільки оцінити 1 параметр.

Пропонована модель передбачає , що ви можете пояснити свої точки даних з р параметрами + вільним членом, так що у вас є р + 1 параметри.

Якщо ваш Null Deviance дійсно малий, це означає, що Null Model пояснює дані досить добре. Так само і з вашим Залишковим відхиленням .

Що означає насправді малий? Якщо ваша модель "хороша", то ваш Deviance становить приблизно Chi ^ 2 з (df_sat - df_model) ступенем свободи.

Якщо ви хочете порівняти модель Null з запропонованою вами моделлю, тоді ви можете подивитися

(Нульове відхилення - залишкове відхилення) приблизно Chi ^ 2 з df пропоновано - df Null = (n- (p + 1)) - (n-1) = p

Чи є результати, які ви дали безпосередньо від R? Вони здаються трохи дивними, тому що, як правило, ви повинні бачити, що градуси свободи, повідомлені про Null, завжди вище, ніж ступінь свободи, про яку повідомляється на Залишковому. Це тому, що знову ж таки, нульове відхилення df = насичене df - нулеве df = n-1 Залишкове відхилення df = насичене df - пропоноване df = n- (p + 1)


Так, це дуже корисне написання @TeresaStat, дякую. Наскільки це надійно? Чи змінюються визначення, якщо ви говорите про багаточленну модель, а не про GLM?
Hack-R

@Teresa: Так, ці результати отримані від R. Чому б це сталося? Якась проблема з моделлю тут?
Анджалі

@ Hack-R: вибачте за таку пізню відповідь, я новачок у Stackexchange. Для мультиноміальних моделей ви не використовуєте функцію glm в R, а вихідний сигнал інший. Вам потрібно буде переглянути або модель пропорційних шансів, або порядкову регресію, функцію mlogit. Варто трохи почитати про мультиноміальні glms, вони мають дещо різні припущення. Якщо я можу дістатись до нього під час перерви, я оновлю це ще трохи інформації.
TeresaStat

@Anjali, я не зовсім впевнений, чому ви отримаєте такі результати в Р. Важко це знати, не бачачи ваших даних / результатів. Взагалі я не бачу, чому залишкові ступені свободи були б вищими за нульовий df. Скільки параметрів ви оцінювали?
ТерезаСтат

1
@ user4050 Ціль моделювання в цілому можна розглядати як використання найменшої кількості параметрів, щоб пояснити найбільше про вашу відповідь. Щоб зрозуміти, скільки параметрів використовувати, потрібно переглянути перевагу додавання ще одного параметра. Якщо додатковий параметр багато пояснює (створює великі відхилення) від вашої меншої моделі, тоді вам потрібен додатковий параметр. Для того, щоб оцінити, що багато, вам потрібна статистична теорія. Теорія говорить нам, що відхилення chi у квадраті зі ступенем свободи, рівним різниці параметрів між вашими двома моделями. Чи ясніше?
ТерезаСтат

13

Нульове відхилення показує, наскільки добре відповідь прогнозується моделлю, окрім перехоплення.

Залишкове відхилення показує, наскільки добре відповідь прогнозується моделлю при включенні предикторів. З вашого прикладу видно, що відхилення зростає на 3443,3, коли додаються 22 змінних прогнозова (примітка: ступінь свободи = немає спостережень - немає прогнозів). Це збільшення відхилення є свідченням значної недостатньої придатності.

Ми також можемо використовувати залишкове відхилення, щоб перевірити, чи справжня нульова гіпотеза (тобто модель логістичної регресії забезпечує адекватну відповідність даним). Це можливо, оскільки відхилення задається значенням c-квадрата при певній ступені свободи. Для того, щоб перевірити на значимість, ми можемо виявити пов'язані р-значення, використовуючи формулу нижче в R:

p-value = 1 - pchisq(deviance, degrees of freedom)

Використовуючи наведені вище значення залишкового відхилення та DF, ви отримуєте значення p приблизно приблизно нулю, показуючи, що існує суттєвий брак доказів на підтвердження нульової гіпотези.

> 1 - pchisq(4589.4, 1099)
[1] 0

2
Звідки ви знаєте, що таке відсіч для хорошого / поганого пристосування, виходячи з відхилення та кількості змінних прогнозів (без pchisq)? Це просто, якщо Залишкове відхилення> NULL Deviance або є деякий діапазон / відношення?
Hack-R

3
Ваша відповідь не є помилковою, але є предметом непорозуміння. Насправді це було неправильно зрозуміло (див. Тут ). Зважаючи на це, чи можете ви уточнити відмінності, які містяться у вашому коді?
gung - Відновіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.