Можливий діапазон


10

Припустимо, це три часові ряди, X1, X2 і Y

Запуск звичайної лінійної регресії на Y ~ X1 (Y=bX1+b0+ϵ ), ми отримуємо R2=U. Звичайна лінійна регресіяY ~ X2 дістати R2=V. ПрипустимоU<V

Які мінімальні та максимально можливі значення R2 на регресію Y ~ X1+X2 (Y=b1X1+b2X2+b0+ϵ )?

Я вважаю мінімумом R2 має бути V + невелике значення, оскільки додавання нових змінних завжди збільшується R2, але я не знаю, як оцінити це невелике значення, і я не знаю, як отримати максимальний діапазон.

Відповіді:


9

1) EDIT: Коментар кардинала нижче показує, що правильна відповідь на хв R2 питання є V. Отже, я видаляю свою "цікаву", але в кінцевому рахунку неправильну відповідь на цю частину посади ОП.

2) Максимум R2 є 1. Розгляньте наступний приклад, який відповідає вашому випадку.

x1 <- rnorm(100)
x2 <- rnorm(100)
y <- x1 + 2*x2

> summary(lm(y~x1))$r.squared
[1] 0.2378023                 # This is U
> summary(lm(y~x2))$r.squared
[1] 0.7917808                 # This is V; U < V
> summary(lm(y~x1+x2))$r.squared
[1] 1

Тут ми фіксуємо дисперсію ϵ при 0. Якщо хочете σϵ2>0, однак, справи дещо змінюються. Ви можете отриматиR2 довільно близький до 1, роблячи σϵ2все менше і менше, але, як і з мінімальною проблемою, ви не можете потрапити туди, тому немає максимуму. 1 стає верхом , оскільки завжди більший, ніжR2 але це також межа як σϵ20.


2
(+1) Деякі коментарі: Це хороша відповідь; цікаво, що ви застосували асимптотичний підхід, тоді як незрозуміло, чи зацікавлена ​​ОП у тому, чи, можливо, фіксований-nодин (або обидва). Ця відповідь трохи не відповідає суперечності ОП, щоU<V, хоча, і якщо X1=0 або X1=a1 для деяких aR, наприклад, тоді мінімум R2для всіх фіксованих розмірів вибірки є самеV:=V(n). (Вибачте патологію цих прикладів.) Крім того, OLS не обов'язково узгоджується з відсутністю додаткових обмежень для прогнозів. :)
кардинал

@cardinal - перечитуючи, я не можу зрозуміти, чому я застосував такий підхід до проблеми min Vтепер здається, що явно правильна відповідь, і, як ви неявно зауважили, я міг би побудувати приклад, який досягає цього в дусі максимуму ... о, ну, може, моє еспресо сьогодні вранці було випадково без кафе. (Можливо, я повинен більш детально переглянути свої відповіді перед публікацією!)
jbowman

Я не думаю, що вам слід видаляти те, що ви написали, що мені було цікавим підходом до відповіді на питання! Хоча патології, які я згадую, безумовно, допускають мінімумR2, можна задатися питанням, що насправді мається на увазі X1=0. Інший приклад, мабуть, не настільки патологічний, оскільки в загальній версії цієї проблеми він поширюється на той випадок, коли є додатковіXiзнаходиться в просторі стовпців інших прогнокторів. :)
кардинал

1
@cardinal - дякую! Я реконструюю його, можливо, трохи формальніше, і через деякий час поверну його внизу.
jbowman

5

Дозволяє r1,2 дорівнює співвідношенню між X1 і X2, r1,Y дорівнює співвідношенню між X1 і Y, і r2,Y співвідношення між X2 і Y. ТодіR2 для повної моделі, поділеної на V дорівнює

(1(1r1,22))(12r1,2r1,Yr2,Y+UV).

Тому R2 для повної моделі дорівнює V тільки якщо r1,2=0 і r1,Y2=U=0 або

r1,22=2r1,2r1,Yr2,YUV.

Якщо r1,2=0, R2 для повної моделі дорівнює U+V.


(+1) Симпатично. Ласкаво просимо на сайт. Подумайте про реєстрацію свого акаунта, щоб ви могли брати участь більш повно Пізніше мені доведеться детальніше розглянути цей вираз. :)
кардинал

4

Без обмежень U і V, то мінімум - V, і тоді максимум менший min(V+U,1). Це тому, що дві змінні можуть бути ідеально співвіднесені (у цьому випадку додавання другої змінної не змінює значенняR2 взагалі) або вони можуть бути ортогональними, у тому випадку, включаючи обидва результати в U+V. У коментарях було справедливо зазначено, що це також вимагає, щоб кожен був ортогональним1, вектор стовпців 1s.

Ви додали обмеження U<VX1X2. Однак все-таки можливоU=0. Це є,X1Y, У якому випадку, min=max=V+0. Нарешті, можливо, щоX1X2 тому верхня межа нерухома min(V+U,1).

Якби ви знали більше про стосунки між X1 і X2, Я думаю, ви могли б сказати більше.


1
(+1) Але зауважте, що це не зовсім (правда) X1 і X2 є ортогональними, то їх індивідуальними R2Значення будуть підсумовуватись, включаючи обидва в модель. Нам також потрібно, щоб вони були ортогональними для вектора всіх1. Зверніть увагу, що ви можете використовуватиLATEXна цьому сайті для розмітки математики. :)
кардинал

Це правда. Дуже дякую за коментарі та за те, що наголосили на цьомуLATEXможе бути використано. Я думав, що це можливо, але я спробував втекти з стилю математика (і [для вбудованих / рівнянь. Писання так, як я б в TeX працював як шарм :)
Джошуа
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.