Чи повинен частковий додати до загального при множинній регресії?


12

Далі представлена ​​модель, створена з mtcarsнабору даних:

> ols(mpg~wt+am+qsec, mtcars)

Linear Regression Model

ols(formula = mpg ~ wt + am + qsec, data = mtcars)

                Model Likelihood     Discrimination    
                   Ratio Test           Indexes        
Obs       32    LR chi2     60.64    R2       0.850    
sigma 2.4588    d.f.            3    R2 adj   0.834    
d.f.      28    Pr(> chi2) 0.0000    g        6.456    

Residuals

    Min      1Q  Median      3Q     Max 
-3.4811 -1.5555 -0.7257  1.4110  4.6610 

          Coef    S.E.   t     Pr(>|t|)
Intercept  9.6178 6.9596  1.38 0.1779  
wt        -3.9165 0.7112 -5.51 <0.0001 
am         2.9358 1.4109  2.08 0.0467  
qsec       1.2259 0.2887  4.25 0.0002  

Модель здається гарною із загальним 0,85. Однак часткові значення видно на наступному графіку, не додають до цього значення. Вони складають приблизно 0,28.R 2R2R2

> plot(anova(mod), what='partial R2')

введіть тут опис зображення

Чи існує якесь співвідношення між сумою всіх часткових та загальною ? Аналіз робиться з пакетом.R 2R2R2rms


1
(На додаток до дуже хорошої відповіді амеби) Близьке запитання щодо стандартизованого коефіцієнта регресії та часткової кореляції stats.stackexchange.com/q/76815/3277 .
ttnphns

Відповіді:


11

Немає.

Один із способів зрозуміти частковий для даного предиктора - це те, що він дорівнює який ви отримаєте, якщо ви вперше регресуєте свою незалежну змінну на всіх інших предикторах , візьмете залишки та регресуєте ті, що залишилися передбачувачем.R 2R2R2

Отже, якщо, наприклад, всі предиктори ідеально однакові (колінеарні), можна мати гідний , але частковий для всіх предикторів буде рівно нульовим, оскільки будь-який окремий предиктор має нуль додаткової пояснювальної сили.R 2R2R2

З іншого боку, якщо всі предиктори разом пояснюють залежну змінну досконало, тобто , то частковий для кожного предиктора буде також , тому що все, що не пояснено всіма іншими предикторами, може бути ідеально пояснено рештою один.R 2 1R2=1R21

Тож сума всіх часткових легко може бути нижче або вище загальної . Вони не повинні збігатися, навіть якщо всі прогнози є ортогональними. Частковий - трохи дивна міра.R 2 R 2R2R2R2

Дивіться цю довгу нитку для більш детальної інформації: Важливість предикторів у множинній регресії: Часткова проти стандартизованих коефіцієнтівR2 .


Дякую за дуже чітке пояснення. Це може статися і в ситуації з цим питанням: stats.stackexchange.com/questions/155447/… . Тоді частковий R ^ 2 є розумним показником важливості чи внеску окремих прогнозів? Або ви б запропонували щось інше, наприклад, "пропорція R ^ 2" або "решта R ^ 2" або "chisq" або "chisq мінус df" або "пропорція chisq" або "aic"? Все це доступно в пакеті rms. Або стандартизовані коефіцієнти?
rnso

Так, я не впевнений, чому це питання було відкладено як незрозуміле; Я думаю, що це зрозуміло (і це майже дублікат цього, але, мабуть, не зовсім). Щодо розумних показників важливості прогнозів: я настійно пропоную вам прочитати тему, до якої я пов’язаний у своїй відповіді, що стосується саме цього питання. Там є і моя власна відповідь, де я коротко оглядаю декілька різних показників. Усі вони мають різні недоліки; видається, що немає (і не може бути) ідеального рішення цієї проблеми.
амеба

Я поклав його на утримання , як неясно , тому що ніякого пояснення взагалі не було дано , як розрізнялися дві моделі. Можливо, я помилявся, думаючи, що потрібна відповідь у цій конкретній ситуації. З огляду на цю відповідь, чи хтось із вас вважає, що вона потребує повторного відкриття?
Scortchi

Таким чином, частковий R2 можна порівняти в межах одного графіка, а не між двома графіками. Також "частковий R2" насправді не вказує на внесок у загальний R2, і тому я вважаю, що це неправильне значення. Іншого питання зараз немає, оскільки тут я отримав відповідь.
rnso

Я підтримую всі відповіді. Вже тоді я прийняв переважну більшість своїх запитань.
rnso
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.