Чому кількість дисперсії, поясненої моїм 1-м ПК, настільки близька до середнього парного співвідношення?


9

Який взаємозв'язок між першою основною складовою (частинами) та середньою кореляцією у кореляційній матриці?

Наприклад, в емпіричному застосуванні я зауважую, що середнє співвідношення майже таке ж, як відношення дисперсії першого головного компонента (першого власного значення) до загальної дисперсії (сума всіх власних значень).

Чи є математичний зв’язок?

Нижче наведено графік емпіричних результатів. Якщо кореляція - це середня кореляція між коефіцієнтом фондового індексу DAX, обчисленим протягом 15-денного прокатного вікна, і поясненою дисперсією є частка дисперсії, поясненої першим головним компонентом, також обчислена за 15-денне вікно прокатки.

Чи можна пояснити це загальною моделлю факторів ризику, такою як CAPM?

введіть тут опис зображення


1
Як ви гадаєте, що відбувається, коли багато кореляцій є від'ємними або майже нульовими? Наприклад, генерувати деякі двовимірні нормальні дані з нульовою кореляцією. Чому ви очікуєте, що між вашим коефіцієнтом дисперсії та нульовим співвідношенням існує якась залежність?
whuber

Відповіді:


6

Я вважаю, що зв'язок між середньою кореляцією та власним значенням 1-го ПК існує, але не є унікальним. Я не математик, який зможе це вивести, але можу принаймні показати початкову точку, з якої може вирости інтуїція чи думка.

Якщо ви намалюєте стандартизовані змінні як вектори в евклідовому просторі, який розміщує його (і це скорочений простір, де осі спостереження), кореляція - це косинус між двома векторами .

введіть тут опис зображення

А оскільки вектори мають всю одиничну довжину (завдяки стандартизації), косинуси - це проекції векторів один на одного (як показано на лівому малюнку з трьома змінними). Перший ПК такий рядок в цьому просторі , який максимізує суму квадратів проекцій на неї, «s, звані навантаження; і ця сума є першим власним значенням.

Отже, коли ви встановлюєте залежність між середнім значенням трьох проекцій ліворуч із сумою (або середнім значенням) трьох квадратних проекцій праворуч, ви відповідаєте на ваше запитання про співвідношення між середньою кореляцією та власним значенням.


6

Я думаю, що тут сталося те, що всі змінні були позитивно співвіднесені між собою. У цьому випадку 1-й ПК досить часто виявляється дуже близьким до середнього показника всіх змінних. Якщо всі змінні позитивно співвідносяться з абсолютно однаковим коефіцієнтом кореляції , то 1-й ПК точно пропорційний середньому серед усіх змінних, як я пояснюю тут: Чи можна усереднення всіх змінних сприймати як грубу форму PCA?c

У цьому простому випадку можна насправді математично вивести відносини, про які ви запитуєте. Розглянемо кореляційну матрицю розміру, яка виглядає так:Перший її власний вектор дорівнює , що відповідає середньому [масштабованому] середньому для всіх змінних. Його власне значення - . Сума всіх власних значень, якщо, звичайно, задана сумою всіх діагональних елементів, тобто . Тож частка поясненої дисперсії на першому ПК дорівнюєn×n

(1cccc1cccc1cccc1).
(1,1,1,1)/nλ1=1+(n1)cλi=n
R2=1n+n1ncc.

Тому в цьому найпростішому випадку частка поясненої дисперсії на першому ПК 100% співвідноситься із середньою кореляцією, а для великих приблизно дорівнює. Це саме те, що ми бачимо на вашому сюжеті.n

Я очікую, що для великих матриць цей результат приблизно буде мати місце, навіть якщо кореляції не зовсім однакові.


Оновлення. Використовуючи фігуру, розміщену у запитанні, можна навіть спробувати оцінити , помітивши, що . Якщо взяти і , то отримаємо . ОП заявила, що дані є "фондовим індексом DAX"; гугливши його, ми бачимо, що він, мабуть, складається з змінних. Непогана відповідність.nn=(1c)/(R2c)c=0.5R2c=0.02n=2530

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.