П'ять бальних резюме
так, ідея полягає в тому, щоб дати короткий підсумок розподілу. Він повинен бути приблизно симетричним щодо середнього, медіана повинна бути близькою до 0, значення 1Q і 3Q в ідеалі повинні бути приблизно подібними.
Коефіцієнти таβi^s
Кожен коефіцієнт у моделі - гауссова (нормальна) випадкова величина. є оцінкою середнього розподілу цієї випадкової величини, і стандартна помилка є квадратний корінь з дисперсії цього розподілу. Це міра невизначеності в оцінці .βi^βi^
Ви можете подивитися, як вони обчислюються (добре, що використовуються математичні формули) у Вікіпедії . Зауважте, що будь-яка поважаюча себе програма статистики не буде використовувати стандартні математичні рівняння для обчислення оскільки виконання їх на комп'ютері може призвести до великої втрати точності в обчисленнях.βi^
t -статистика
У статистичні оцінки ( ) ділиться на їх стандартні помилки ( ), наприклад . Якщо припустити, що у вас є та сама модель в об'єкті, що і ваш Q:tβi^σi^ti=βi^σi^mod
> mod <- lm(Sepal.Width ~ Petal.Width, data = iris)
тоді звіти значень R обчислюються як:t
> tstats <- coef(mod) / sqrt(diag(vcov(mod)))
(Intercept) Petal.Width
53.277950 -4.786461
Де coef(mod)
знаходяться і дає квадратні корені діагональних елементів коваріаційної матриці параметрів моделі, які є стандартними помилками параметрів ( ).βi^sqrt(diag(vcov(mod)))
σi^
Значення р - це ймовірність досягнення aна величину або більше, ніж спостережуване абсолютне значення t, якщо нульова гіпотеза ( ) була правдою, де - . Вони обчислюються як (використовуючи зверху):|t|H0H0βi=0tstats
> 2 * pt(abs(tstats), df = df.residual(mod), lower.tail = FALSE)
(Intercept) Petal.Width
1.835999e-98 4.073229e-06
Тож ми обчислюємо верхню вірогідну ймовірність досягнення значень ми зробили з розподілу зі ступенями свободи, рівними залишковим ступеням свободи моделі. Це представляє ймовірність досягнення величини більше, ніж абсолютні значення спостережуваних s. Він помножується на 2, оскільки звичайно може бути великим і в негативному напрямку.ttttt
Залишкова стандартна помилка
Залишкова стандартна помилка - це оцінка параметра . Припущення у звичайних найменших квадратах полягає в тому, що залишки описуються індивідуально гауссовим (нормальним) розподілом із середнім значенням 0 та стандартним відхиленням . відноситься до постійної дисперсії припущення; кожен залишок має однакову дисперсію і ця дисперсія дорівнює .σσσσ2
РегульованийR2
Відрегульований обчислюється як:R2
1−(1−R2)n−1n−p−1
Відрегульований - це те саме, що і , але скоригований на складність (тобто кількість параметрів) моделі. Враховуючи модель з одним параметром, з певним , якщо до цієї моделі додати ще один параметр, нової моделі має збільшуватися, навіть якщо доданий параметр не має статистичної потужності. Коригуваний пояснює це, включаючи кількість параметрів у модель.R2R2R2R2R2
F -статистичний
являє собою відношення двох дисперсій ( ), дисперсія пояснюється параметрами в моделі (сума квадратів регресії, SSR) і залишкова дисперсією або незрозумілою (сума квадратів помилок, SSE). Ви можете побачити це краще, якщо ми отримаємо таблицю ANOVA для моделі за допомогою :FSSR/SSEanova()
> anova(mod)
Analysis of Variance Table
Response: Sepal.Width
Df Sum Sq Mean Sq F value Pr(>F)
Petal.Width 1 3.7945 3.7945 22.91 4.073e-06 ***
Residuals 148 24.5124 0.1656
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Значення s однакові у виході та виході ANOVA . Стовпець містить дві дисперсії і . Ми можемо обчислити ймовірність досягнення величини за нульовою гіпотезою про відсутність ефекту з розподілу з 1 та 148 градусами свободи. Про це повідомляється у заключній колонці таблиці ANOVA. У простому випадку одинарного безперервного предиктора (згідно з вашим прикладом) , тому значення p однакові. Ця еквівалентність справедлива лише в цьому простому випадку.F3,7945 / 0,1656 = 22,91 Р Р Р = т 2 Р е т в л . Ш і д т чsummary(mod)
Mean Sq
3.7945/0.1656=22.91FFF=t2Petal.Width