Чому коригується R-квадрат менше, ніж R-квадрат, якщо відрегульований R-квадрат прогнозує модель краще?


15

Наскільки я розумію, пояснює, наскільки добре модель прогнозує спостереження. Налагоджений - це той, який враховує більше спостережень (або ступенів свободи). Отже, скоригований прогнозує модель краще? Тоді чому це менше ? Здається, часто повинно бути більше.R2R2R2R2

Відповіді:


30

показує лінійну залежність між незалежними змінними та залежною змінною. Визначається як 1 - S S ER2 - сума помилок у квадраті, поділена на загальну суму квадратів. SSTO=SSE+SSR- загальна помилка та загальна сума квадратів регресії. По мірі додавання незалежних зміннихSSRбуде продовжувати зростати (і оскількиSSTOфіксований)SSEзнизиться, аR2буде постійно зростати, незалежно від того, наскільки цінні додані вами змінні.1SSESSTOSSTO=SSE+SSRSSRSSTOSSER2

Налагоджений намагається врахувати статистичну усадку. Моделі з тоннами предикторів мають більшу ефективність у вибірці, ніж при випробуванні поза вибіркою. Відкоригований R 2 "штрафує" вас за додавання додаткових змінних прогнозів, які не покращують існуючу модель. Це може бути корисним у виборі моделі. Відрегульований R 2 буде дорівнює R 2 для однієї змінної предиктора. У міру додавання змінних він буде меншим, ніж R 2 .R2R2R2R2R2


Не ясно, яким чином скоригований R квадрат досягає загострених властивостей. Тобто, що таке формула і як вона викликає властивості?
Олексій Войтенко

Adj R ^ 2 = 1 - ((n -1) / (n - k -1)) (1 - R ^ 2)
гірський альпініст

Де k = # незалежних змінних, n = # спостереження
гірський альпініст

спроба обліку статистичної усадки - можливо, для надмірного пристосування?
Річард Харді

-1

R ^ 2 пояснює частку варіації вашої залежної змінної (Y), пояснену вашими незалежними змінними (X) для лінійної регресійної моделі.

Під час коригування R ^ 2 йдеться про частку варіації вашої залежної змінної (Y), пояснену більш ніж 1 незалежною змінною (X) для лінійної регресійної моделі.


1
Відмінність між "незалежними змінними" та "більш ніж 1 незалежною змінною" не зрозуміла. Також, цитуючи Енді знизу, "Ви дійсно не додаєте нової інформації до того, що було надано раніше".
Амеба каже: Відновіть Моніку

-2

R-Squared збільшується навіть тоді, коли ви додаєте змінні, які не пов'язані із залежною змінною, але відрегульовані R-Squared подбайте про це, оскільки він зменшується щоразу, коли ви додаєте змінні, які не пов'язані із залежною змінною, таким чином, після догляду це ймовірно зменшувати.


3
Враховуючи, що на це питання вже є прийнята відповідь, це має бути більше коментарем. Ви дійсно не додаєте нову інформацію до того, що було надано раніше.
Енді
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.