Чи визначена кожна кореляційна матриця позитивною?


11

Я говорю тут про матриці кореляцій Пірсона.

Я часто чув, як це говорило, що всі кореляційні матриці повинні бути позитивними напівмісячними. Я розумію, що позитивні певні матриці повинні мати власні значення , тоді як позитивні напівфінітні матриці повинні мати власні значення 0 . Це змушує мене думати, що моє запитання можна перефразувати як "Чи можливо для матриць кореляції мати власне значення = 0 ?">00=0

Чи можливо для матриці кореляції (згенерованої з емпіричних даних без відсутніх даних) мати власне значення або власне значення < 0 ? Що робити, якщо натомість це матриця кореляції населення?=0<0

Я прочитав у верхній відповіді на це питання про матриці коваріації, що

Розглянемо три змінні, , Y і Z = X + Y . Їх матриця коваріації M не є позитивно визначеною, оскільки існує вектор z ( = ( 1 , 1 , - 1 ) ), для якого z M z не додатний.XYZ=X+YMz=(1,1,1)zMz

Однак якщо замість коваріаційної матриці я виконую ці розрахунки на кореляційній матриці, то виходить як позитивний. Тому я думаю, що, можливо, ситуація відрізняється для матриць кореляції та коваріації.zMz

Моя причина запитання полягає в тому, що мене запитали на stackoverflow , стосовно запитання, яке я задав там.


Якщо, наприклад, два атрибути - це одне, тільки вони мають різні назви, матриця є сингулярною. Якщо два атрибути додають до константи, це знову однина, тощо .
ttnphns

Якщо коваріаційна матриця є сингулярною, то матриця кореляції також є сингулярною.
ttnphns

2
Близькі дублікати: Чи є кожна матриця кореляції позитивною напіввизначеною? який має менший фокус на визначеному проти напіввизначеного кута, і чи є кожна матриця коваріації позитивною? що доречно, оскільки коваріація є по суті шкалою кореляції.
Срібна рибка

Відповіді:


16

Кореляційні матриці не повинні бути позитивними.

Розглянемо скалярну випадкову величину X, що має ненульову дисперсію. Тоді кореляційна матриця X із самим собою є матрицею всіх, яка є позитивною напіввизначеною, але не позитивно визначеною.

Що стосується співвідношення вибірки, врахуйте дані вибірки для вищезазначених, маючи перше спостереження 1 і 1, а друге спостереження 2 і 2. Це призводить до того, що кореляція вибірки є матрицею всіх, тому не є позитивно визначеною.

Зразок матриці кореляції, якщо обчислений у точній арифметиці (тобто без помилки округлення), не може мати негативні власні значення.


4
Можливо, варто згадати можливі ефекти пропущених значень на матрицю кореляції вибірки . Числовий нечіт не є єдиною причиною отримання негативного власного значення в матриці кореляції / коваріації вибірки.
Срібна рибка

1
Так, я не робив це явним чином, але я припускав, згідно з заявою питання, "без відсутніх даних". Як тільки ви потрапите в дикий, хитрий світ відсутніх даних та коригувань для них, все вийде.
Марк Л. Стоун

Так, вибачте, ви абсолютно праві, на питання сказано: "відсутні дані" - я просто подумав, що варто десь згадати, оскільки майбутні пошукачі можуть зацікавитись, навіть якщо апетит ОП насичений!
Срібна рибка

7

Відповіді @yoki та @MarkLStone (+1 до обох) вказують, що матриця кореляції сукупності може мати нульові власні значення, якщо змінні лінійно пов'язані (наприклад, на прикладі @MarkLStone та X 1 = 2 X 2 на прикладі @yoki).X1=X2X1=2X2

n<pn1pn+1n1


Справжній 'дат. Я припускаю, що я міг би і міг би надати цю інформацію, але моя мета полягала в тому, щоб створити контрприклад для спростування гіпотези ОП, тим самим виявивши її недійсність. Тим не менш, слід скорегувати друге речення таким чином, щоб воно було "У цьому випадку матриці коваріації та кореляції буде максимум рангом n − 1, тому буде принаймні (p − n + 1) нульових власних значень. "
Марк Л. Стоун

4

XY=2X(X,Y)2X=YE[Y2]=4E[X2]=σY2E[XY]=2E[X2]Cov(X,Y)=E[XY]EXEY=E[XY]

Λ=(1224),
Λ=(1111),
XY

2Λcov(X,Y)=E(XY)E(X)E(Y)=2E[X2]=2(σX2+[E(X)]2)E(X2)=Var(X)+[E(X)]2

diagΛ1/2ΛdiagΛ1/2

@AntoniParellada, я не точно впевнений, що ти маєш на увазі - коваріація тут - прямий розрахунок. Але я відредагую і зроблю це зрозуміліше. Дякую.
йокі
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.