Як розділити r-квадрат між змінними предиктора в множинній регресії?


16

Я щойно прочитав статтю, в якій автори провели багаторазову регресію з двома прогнозами. Загальне значення r-квадрата становило 0,65. Вони надали таблицю, яка розділила r-квадрат між двома прогнозами. Таблиця виглядала так:

            rsquared beta    df pvalue
whole model     0.65   NA  2, 9  0.008
predictor 1     0.38 1.01 1, 10  0.002
predictor 2     0.27 0.65 1, 10  0.030

У цій моделі, Rвикористовуваній mtcarsнаборі даних, загальне значення r-квадрата становить 0,76.

summary(lm(mpg ~ drat + wt, mtcars))

Call:
lm(formula = mpg ~ drat + wt, data = mtcars)

Residuals:
    Min      1Q  Median      3Q     Max 
-5.4159 -2.0452  0.0136  1.7704  6.7466 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   30.290      7.318   4.139 0.000274 ***
drat           1.442      1.459   0.989 0.330854    
wt            -4.783      0.797  -6.001 1.59e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Residual standard error: 3.047 on 29 degrees of freedom
Multiple R-squared:  0.7609,    Adjusted R-squared:  0.7444 
F-statistic: 46.14 on 2 and 29 DF,  p-value: 9.761e-10

Як я можу розділити значення r-квадрата між двома змінними предиктора?


1
Цей пост містить інформацію про те, як розділити . R2
COOLSerdash

8
Цей коментар може представляти, коротко і неадекватно, точку зору, що це часто виявиться марним, якщо не небезпечним. Успіх або невдача моделі найкраще розцінюється як результат зусиль команди передбачувачами (та їх особливими функціональними формами, умовами взаємодії тощо, тощо) і слід оцінювати як таку. Звичайно, більшість із нас зацікавлені у відносній важливості прогнозів, і це не дурниці, але спроби їх кількісної оцінки точно повинні супроводжуватися повними твердженнями технічних та філософських обмежень щодо такого вправи.
Нік Кокс

Відповіді:


5

Ви можете просто отримати дві окремі кореляції та квадратні, або запустити дві окремі моделі та отримати R ^ 2. Вони підсумовуватимуться лише в тому випадку, якщо прогнози ортогональні.


2
Під "ортогональним" ви маєте на увазі, що два предиктори повинні бути неспорідненими один з одним?
лучано

3
Так, некорельовані ... це єдиний спосіб, коли вони підсумовують загальну суму.
Джон

13

На додаток до відповіді Джона , ви можете отримати бажані часткові кореляції у квадраті для кожного передбачувача.

  • Неспоріднені предиктори : Якщо предиктори ортогональні (тобто некоррельовані), то квадратичні часткові кореляції будуть такими ж, як і квадратні кореляції нульового порядку.
  • Корельовані предиктори: Якщо предиктори співвідносяться, то квадратична часткова кореляція представлятиме унікальну дисперсію, пояснену даним предиктором. У цьому випадку сума квадратичних часткових кореляцій буде меншою, ніж . Ця залишилася пояснена дисперсія буде представляти собою дисперсію, пояснену більш ніж однією змінною.R2

Якщо ви шукаєте функцію R, вона є spcor()в ppcorупаковці.

Ви також можете розглянути більш широку тему оцінювання змінної важливості при багаторазовій регресії (наприклад, дивіться цю сторінку про пакет relaimpo ).


3

Я додав тег до вашого питання. Ось частина його тегів wiki :

R2p!p

Грьомпінг (2007, американський статистик ) дає огляд та вказівки на літературу в контексті оцінки змінної важливості.


y ~ a + by ~ b + ay ~ ay ~ a + by ~ by ~ a + by ~ b + a2p

R2aabR2y~1y~abR2y~by~a+b

2p2!

2p=q=0p(pq)(pq)qpq=0qqq=1pq(pq)2p
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.