Відповіді:
Нехай LL = логічність
Ось короткий підсумок того, що ви бачите з результатів підсумків (glm.fit),
Нульове відхилення = 2 (LL (насичена модель) - LL (нульова модель)) на df = df_Sat - df_Null
Залишковий відхилення = 2 (LL (насичена модель) - LL (пропонована модель)) df = df_Sat - df_Proposed
Насичена Модель являє собою модель , яка передбачає , кожну точку даних має свої власні параметри (що означає , що ви установках для оцінки.)
Null модель передбачає точні «зворотний», в який приймає один параметр для всіх точок даних, що означає , що ви тільки оцінити 1 параметр.
Пропонована модель передбачає , що ви можете пояснити свої точки даних з р параметрами + вільним членом, так що у вас є р + 1 параметри.
Якщо ваш Null Deviance дійсно малий, це означає, що Null Model пояснює дані досить добре. Так само і з вашим Залишковим відхиленням .
Що означає насправді малий? Якщо ваша модель "хороша", то ваш Deviance становить приблизно Chi ^ 2 з (df_sat - df_model) ступенем свободи.
Якщо ви хочете порівняти модель Null з запропонованою вами моделлю, тоді ви можете подивитися
(Нульове відхилення - залишкове відхилення) приблизно Chi ^ 2 з df пропоновано - df Null = (n- (p + 1)) - (n-1) = p
Чи є результати, які ви дали безпосередньо від R? Вони здаються трохи дивними, тому що, як правило, ви повинні бачити, що градуси свободи, повідомлені про Null, завжди вище, ніж ступінь свободи, про яку повідомляється на Залишковому. Це тому, що знову ж таки, нульове відхилення df = насичене df - нулеве df = n-1 Залишкове відхилення df = насичене df - пропоноване df = n- (p + 1)
Нульове відхилення показує, наскільки добре відповідь прогнозується моделлю, окрім перехоплення.
Залишкове відхилення показує, наскільки добре відповідь прогнозується моделлю при включенні предикторів. З вашого прикладу видно, що відхилення зростає на 3443,3, коли додаються 22 змінних прогнозова (примітка: ступінь свободи = немає спостережень - немає прогнозів). Це збільшення відхилення є свідченням значної недостатньої придатності.
Ми також можемо використовувати залишкове відхилення, щоб перевірити, чи справжня нульова гіпотеза (тобто модель логістичної регресії забезпечує адекватну відповідність даним). Це можливо, оскільки відхилення задається значенням c-квадрата при певній ступені свободи. Для того, щоб перевірити на значимість, ми можемо виявити пов'язані р-значення, використовуючи формулу нижче в R:
p-value = 1 - pchisq(deviance, degrees of freedom)
Використовуючи наведені вище значення залишкового відхилення та DF, ви отримуєте значення p приблизно приблизно нулю, показуючи, що існує суттєвий брак доказів на підтвердження нульової гіпотези.
> 1 - pchisq(4589.4, 1099)
[1] 0
GLM
?