Пов'язується для кореляції трьох випадкових величин


28

Існують три випадкові величини, . Три кореляції між трьома змінними однакові. Це є,x,y,z

ρ=cor(x,y)=cor(x,z)=cor(y,z)

Яку найзручнішу межу ви можете дати ρ ?


1
Імовірно, під "фо", ви маєте на увазі rho ( ). Однак ваше питання не зрозуміло. Що ви маєте на увазі під «Якою найсміливішою межею ви можете дати»? ρ
gung - Відновіть Моніку

Ну а назва змінної - це просто манекен. Під найтяжчою межею я маю на увазі щось на зразок [-1, 1] для кореляції, але це явно не є найбільш жорсткою межею.
користувач1352399

Ви маєте на увазі, що rho = cor (x, y) = cor (x, z) = cor (y, z), і які обмеження для rho?
user31264

Так, я маю на увазі, що rho = cor (x, y) = cor (x, z) = cor (y, z) і які обмеження для rho. Діліп, чи можете ви продовжити це, щоб сказати, що rho повинен бути негативним, тобто> = 0?
користувач1352399

1
Навчальний посібник, на який посилаються на це, є Seber & Lee "Лінійний регресійний аналіз" (принаймні, це було в першому виданні ...)
kjetil b halvorsen

Відповіді:


29

Загальна кореляція може мати значення але не . Якщо , то не може дорівнювати але насправді дорівнює . Найменше значення спільної кореляції трьох випадкових величин . Більш загальним є мінімальне спільне співвідношення випадкових величин коли, розглядаються як вектори, вони знаходяться у вершинах симплексу (розмірності ) у -вимірному просторі.+ 1 - 1 ρ X , Y = ρ X , Z = - 1 ρ Y , Z - 1 + 1 - 1ρ+11ρX,Y=ρX,Z=1ρY,Z1+1 п-112n n-1n1n1n1n

Розглянемо дисперсію суми одиничних дисперсійних випадкових величин . Ми маємо, що де - середнє значення значення з коефіцієнтів кореляції. Але оскільки , ми легко отримуємо з що X i var ( n i = 1 X i )nXi ˉ ρ

var(i=1nXi)=i=1nvar(Xi)+i=1njincov(Xi,Xj)=n+i=1njinρXi,Xj(1)=n+n(n1)ρ¯
ρ¯(n2)var(iXi)0(1)
ρ¯1n1.

Отже, середнє значення коефіцієнта кореляції принаймні . Якщо всі коефіцієнти кореляції мають однакове значення , то їх середнє значення також дорівнює і тому у нас є Чи можливі випадкові величини, для яких загальне значення кореляції дорівнює ? Так. Припустимо, що є некорельованими випадковими змінними одиничних дисперсій і встановлюють . Тоді , а 1n1ρρ

ρ1n1.
ρ 1n1XiYi=Xi1nj=1nXj=XiX¯E[Yi]=0
var(Yi)=(n1n)2+(n1)(1n)2=n1n
та даючи Таким чином, - випадкові величини, що досягають мінімального загального значення кореляції . Зауважимо, до речі, що , і так, розглядаються як вектори, випадкові змінні лежать у -вимірній гіперплощині
cov(Yi,Yj)=2(n1n)(1n)+(n2)(1n)2=1n
ρYi,Yj=cov(Yi,Yj)var(Yi)var(Yj)=1/n(n1)/n=1n1.
Yi1n1iYi=0(n1)n-вимірний простір.

25

Найбільш щільна межа - . 1/2ρ1 Усі такі значення можуть насправді з’являтися - жодне неможливо.

Щоб показати, що немає нічого особливо глибокого чи загадкового щодо результату, ця відповідь спочатку представляє цілком елементарне рішення, вимагаючи лише очевидного факту, що відхилення - будучи очікуваними значеннями квадратів - повинні бути негативними. Далі йде загальне рішення (яке використовує дещо складніші алгебраїчні факти).

Елементарне рішення

Варіантність будь-якої лінійної комбінації повинна бути негативною. x,y,z Нехай варіації цих змінних будуть та відповідно. Усі є ненульовими (бо в іншому випадку деякі кореляції не були б визначені). Використовуючи основні властивості дисперсій, ми можемо обчислитиσ2,τ2,υ2

0Var(αx/σ+βy/τ+γz/υ)=α2+β2+γ2+2ρ(αβ+βγ+γα)

для всіх реальних чисел .(α,β,γ)

Якщо припустити, що " , невелика алгебраїчна маніпуляція означає, що це еквівалентноα+β+γ0

ρ1ρ13((α2+β2+γ2)/3(α+β+γ)/3)2.

Термін у правій частині квадрата - це відношення двох засобів живлення . Елементарна потужність середнього нерівності (з вагами ) стверджує , що ставлення не може перевищувати (і дорівнюватиме , коли ). Потім випливає трохи більше алгебри(α,β,γ)(1/3,1/3,1/3)11α=β=γ0

ρ1/2.

Ясний приклад нижче (за участю триваріантних нормальних змінних ) показує, що всі такі значення, , насправді виникають як кореляції. У цьому прикладі використовується лише визначення багатовимірних нормалей, але в іншому випадку не викликається результатів обчислення чи лінійної алгебри.n=3(x,y,z)1/2ρ1

Загальне рішення

Огляд

Будь-яка матриця кореляції - це матриця коваріації стандартизованих випадкових величин, звідки - як і всі кореляційні матриці - вона повинна бути позитивною напіввизначеною. Рівнозначно, його власні значення є негативними. Це накладає на просту умову : вона не повинна бути менше (і, звичайно, не може перевищувати ). З іншого боку , будь-яка така фактично відповідає кореляційної матриці деякого розподілу trivariate, що доводять ці межі стислі можливо.ρ1/21ρ


Виведення умов наρ

Розглянемо кореляційну матрицю на зі всіма значеннями, що не мають діагоналі, рівними(Питання стосується випадку але це узагальнення важче проаналізувати.) Назвемо це За визначенням, - це власне значення за умови, що існує ненульовий вектор такий, щоnnρ.n=3,C(ρ,n).λxλ

C(ρ,n)xλ=λxλ.

Ці власні значення в цьому випадку легко знайти, оскільки

  1. Нехай , обчисли, що1=(1,1,,1)

    C(ρ,n)1=(1+(n1)ρ)1.
  2. Нехай з лише в місці (для ), обчисли цеyj=(1,0,,0,1,0,,0)1jthj=2,3,,n

    C(ρ,n)yj=(1ρ)yj.

Оскільки знайдених на сьогодні власних векторів охоплюють повний розмірний простір (доказ: легке скорочення рядків показує абсолютне значення їх детермінантного рівня, що дорівнює , яке є ненульовим), вони складають основу всіх власних векторів. Тому ми знайшли всі власні значення і визначили, що вони або або (останні з кратністю ). Окрім загальновідомої нерівності задоволеної всіма кореляціями, додатково випливає негативність першого власного значенняnnn1+(n1)ρ1ρn11ρ1

ρ1n1

тоді як негативність другого власного значення не наводить нових умов.


Доказ достатності умов

Імплементація працює в обох напрямках: за умови матриця невід'ємно визначена і тому є допустимою кореляційною матрицею. Наприклад, це кореляційна матриця для багатонармального розподілу. Зокрема, пишіть1/(n1)ρ1,C(ρ,n)

Σ(ρ,n)=(1+(n1)ρ)Inρ(1ρ)(1+(n1)ρ)11

для зворотного коли Наприклад, колиC(ρ,n)1/(n1)<ρ<1.n=3

Σ(ρ,3)=1(1ρ)(1+2ρ)(ρ+1ρρρρ+1ρρρρ+1).

Нехай вектор випадкових змінних має функцію розподілу(X1,X2,,Xn)

fρ,n(x)=exp(12xΣ(ρ,n)x)(2π)n/2((1ρ)n1(1+(n1)ρ))1/2

де . Наприклад, при це дорівнюєx=(x1,x2,,xn)n=3

1(2π)3(1ρ)2(1+2ρ)exp((1+ρ)(x2+y2+z2)2ρ(xy+yz+zx)2(1ρ)(1+2ρ)).

Кореляційна матриця для цих випадкових величин -nC(ρ,n).

Малюнок

Контури функцій щільності Зліва направо, . Зверніть увагу, як щільність зміщується від концентрованої біля площини до концентрації поблизу лінії .fρ,3.ρ=4/10,0,4/10,8/10x+y+z=0x=y=z

Спеціальні випадки та також можуть бути реалізовані шляхом вироджених розподілів; Я не буду вникати в деталі, крім того, щоб зазначити, що в першому випадку розподіл можна вважати підтримуваним на гіперплані , де це сума однаково розподілених середніх значень- Нормальний розподіл, тоді як в останньому випадку (ідеальна позитивна кореляція) він підтримується на лінії, породженій , де він має середнє значення - Нормальний розподіл.ρ=1/(n1)ρ=1x.1=0010


Детальніше про невиродження

Огляд цього аналізу дає зрозуміти, що кореляційна матриця має ранг і має ранг з (тому що тільки один власний вектор має нульове власне значення). Для це робить матрицю кореляції виродженою в будь-якому випадку. В іншому випадку, існування його зворотного доводить, що воно є невиродженим.C(1/(n1),n)n1C(1,n)1n2Σ(ρ,n)


20

Ваша кореляційна матриця є

(1ρρρ1ρρρ1)

Матриця є позитивною напівкінцевою, якщо всі головні неповнолітні неповнолітні всі - негативні. Основні неповнолітні - це детермінанти блоків "північний захід" матриці, тобто 1, детермінанта

(1ρρ1)

і детермінанта самої кореляційної матриці.

1 очевидно позитивний, другий головний мінор - , що не заперечує жодної допустимої кореляції . Визначальним фактором всієї кореляційної матриці є1ρ2ρ[1,1]

2ρ33ρ2+1.

На графіку показано визначник функції за діапазоном допустимих кореляцій . [1,1]введіть тут опис зображення

Ви бачите, що функція не є негативною для діапазону, заданого @stochazesthai (що ви також можете перевірити, знайшовши корені детермінантного рівняння).


Чи не вважаємо ми у вашій відповіді, що ? Чому ми можемо? Var()=1
Старий чоловік у морі.

1
@Anold Ви, здається, читаєте "коваріацію", де пишеться "кореляція".
whuber

6

Існують випадкові величини , і з попарними кореляціями тоді і лише тоді, коли матриця кореляції є позитивною напівкінцевою. Це трапляється лише для .XYZρXY=ρYZ=ρXZ=ρρ[12,1]


2
чи можете ви пояснити це дуже простими словами.
Елізабет Сьюзен Джозеф

1
Я не думаю, що існує пояснення, яке не потребує знання матричної алгебри. Я пропоную вам переглянути сторінку Wikipedia ( en.wikipedia.org/wiki/… ).
stochazesthai

4
Я знайшов пояснення, що вимагає лише базової алгебри (середній рівень), і включив це у свою відповідь.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.