Чому квадрати дає пояснену дисперсію?


13

Це може бути основним питанням, але мені було цікаво, чому значення в регресійній моделі може бути просто в квадрат, щоб дати фігуру поясненої дисперсії?R

Я розумію, що коефіцієнт може дати силу відносинам, але я не розумію, як просто квадратування цього значення дає міру поясненої дисперсії.R

Будь-яке просте пояснення цьому?

Дуже дякую за допомогу в цьому!


Шукаєте щось інтуїтивне чи більш математичне? Ви переглянули деякі інші запитання щодо та коефіцієнтів кореляції на цьому веб-сайті? R2
кардинал

1
Наприклад, два пов'язані питання тут і тут . Якщо пограти з рівняннями там, ви зможете отримати математичну еквівалентність. Але з точки зору інтуїції вони, ймовірно, не будуть особливо корисні.
кардинал

Я бачу це навпаки. Це R-квадрат, який визначається як 1 -резидальна дисперсія / загальна дисперсія, і тоді R є квадратним коренем цього рівня. Так буває, що коли ми маємо просту лінійну регресію, квадрат R зменшується до квадрата коефіцієнта кореляції.
Майкл Р. Черник

@Michael, ти, безперечно, мав намір сказати коректно підписаний квадратний корінь, а не позитивний .
кардинал

1
@cardinal, у мене таке ж враження - (або ) відноситься до коефіцієнта кореляції вибірки, і я був би здивований, побачивши широко використовуване посилання, яке використовує це для посилання на абсолютне значення кореляції вибіркиrRr
Макрос

Відповіді:


15

Ручний wavingly, співвідношення можна розглядати як міру кута між двома векторами, залежним вектором і незалежним вектором . Якщо кут між векторами дорівнює , кореляція дорівнює . Частина що пояснюється має довжину і паралельна (або проекції на ). Та частина , яка пояснена має довжину і ортогональна . З точки зору дисперсій ми маємо Y X θ R cos ( θ ) Y X | | Y | | cos ( θ ) X Y X | | Y | | sin ( θ ) X σ 2 Y = σ 2 Y cos 2 ( θ ) + σ 2 Y sin 2 ( θ ) R 2RYXθRcos(θ)YX||Y||cos(θ)XYX||Y||sin(θ)X

σY2=σY2cos2(θ)+σY2sin2(θ)
де перший доданок праворуч - це пояснена дисперсія, а другий - незрозуміла дисперсія. Фракція , яка пояснюється, таким чином , а НЕ .R2R

2
(+1) Тут не дуже багато рукоділля. На мій погляд, геометрична точка зору є найбільш інтуїтивно зрозумілою. Там, швидше за все, є якісна фігура з відкритим кодом, яка зображує речі саме так.
кардинал

(+1) Я почав писати пряме виведення, що дорівнює звичайному визначенню як відношення дисперсій, але, роблячи це, Я помітив, що це мало інтуїції / ніякої інтуїції (і тому, ймовірно, це не буде корисним для оригінального плаката) - я думаю, що це так! R 2cor(y,y^)2R2
Макрос

1
Це не дає відповіді на питання, але показує, як R-квадрат згадується як квадрат коефіцієнта кореляції без будь-якого посилання на R. Тому джерела, що підтверджують або спростовують мою заяву, важко знайти. Це зі статті про коефіцієнт детермінації у Вікіпедії:
Майкл Р. Черник

Як коефіцієнт кореляції у квадраті Аналогічно, після найменшої регресії квадратів з постійною + лінійною моделлю (тобто простою лінійною регресією), R2 дорівнює квадрату коефіцієнта кореляції між спостережуваними та модельованими (прогнозованими) значеннями даних.
Майкл Р. Черник

За загальних умов значення R2 іноді обчислюють як квадрат коефіцієнта кореляції між вихідними та модельованими значеннями даних. У цьому випадку значення не є безпосередньо показником того, наскільки хорошими є модельовані значення, а скоріше мірою того, наскільки хороший предиктор може бути побудований із модельованих значень (шляхом створення переглянутого прогноктора форми α + βƒi). Згідно з Еверіттом (2002, стор. 78), це використання конкретно є визначенням терміна "коефіцієнт визначення": квадрат кореляції між двома (загальними) змінними.
Майкл Р. Черник
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.