Як кореляція, так і коваріантність вимірюють лінійну асоціацію між двома заданими змінними, і вона не зобов'язана виявляти будь-яку іншу форму асоціації.
Тож ці дві змінні можуть бути пов'язані декількома іншими нелінійними способами, а коваріація (і, отже, кореляція) не може відрізняти від незалежного випадку.
Як дуже дидактичні, штучний і не реалістичний приклад, можна вважати таке , що Р ( Х = х ) = 1 / 3 для ї = - 1 , 0 , 1 , а також розглянути Y = Х 2 . Зауважте, що вони не тільки пов'язані, але одне є функцією іншого. Тим не менше, їх коваріація дорівнює 0, оскільки їх асоціація є ортогональною відносно асоціації, яку коваріація може виявити.ХП( X= Х ) = 1 / 3х = - 1 , 0 , 1Y= X2
EDIT
Дійсно, як вказував @whuber, вищенаведена оригінальна відповідь насправді була коментарем щодо того, як твердження не є універсальним, якщо обидві змінні не були неодмінно дихотомічними. Моє ліжко!
Тож давайте математику. (Місцевий еквівалент фільму Барні Стінсона "Костюм!")
Конкретний випадок
Якщо обидва і Y були дихотомічними, то можна без втрати спільності припустити, що обидва припускають лише значення 0 і 1 з довільними ймовірностями p , q і r, заданими
P ( X = 1 ) = p ∈ [ 0 , 1 ] P ( Y = 1 ) = q ∈ [ 0 , 1 ] P ( X = 1 , YХY01pqr
які характеризують повністю спільний розподілXіY. Звертаючись до підказки @ DilipSarwate, зауважте, що цих трьох значень достатньо для визначення спільного розподілу(X,Y), оскільки
P ( X = 0 , Y = 1 )
P(X=1)=p∈[0,1]P(Y=1)=q∈[0,1]P(X=1,Y=1)=r∈[0,1],
XY(X,Y)
(З боку бічної ноти, звичайно,
rзобов'язаний дотримуватися як
p-r∈[0,1],
q-r∈[0,1], такі
1-p-q-r∈[P(X=0,Y=1)P(X=1,Y=0)P(X=0,Y=0)=P(Y=1)−P(X=1,Y=1)=q−r=P(X=1)−P(X=1,Y=1)=p−r=1−P(X=0,Y=1)−P(X=1,Y=0)−P(X=1,Y=1)=1−(q−r)−(p−r)−r=1−p−q−r.
rp−r∈[0,1]q−r∈[0,1]1−p−q−r∈[0,1] beyond
r∈[0,1], which is to say
r∈[0,min(p,q,1−p−q)].)
Notice that r=P(X=1,Y=1) might be equal to the product p⋅q=P(X=1)P(Y=1), which would render X and Y independent, since
P(X=0,Y=0)P(X=1,Y=0)P(X=0,Y=1)=1−p−q−pq=(1−p)(1−q)=P(X=0)P(Y=0)=p−pq=p(1−q)=P(X=1)P(Y=0)=q−pq=(1−p)q=P(X=0)P(Y=1).
Yes, r might be equal to pq, BUT it can be different, as long as it respects the boundaries above.
Well, from the above joint distribution, we would have
E(X)E(Y)E(XY)Cov(X,Y)=0⋅P(X=0)+1⋅P(X=1)=P(X=1)=p=0⋅P(Y=0)+1⋅P(Y=1)=P(Y=1)=q=0⋅P(XY=0)+1⋅P(XY=1)=P(XY=1)=P(X=1,Y=1)=r=E(XY)−E(X)E(Y)=r−pq
Now, notice then that X and Y are independent if and only if Cov(X,Y)=0. Indeed, if X and Y are independent, then P(X=1,Y=1)=P(X=1)P(Y=1), which is to say r=pq. Therefore, Cov(X,Y)=r−pq=0; and, on the other hand, if Cov(X,Y)=0, then r−pq=0, which is to say r=pq. Therefore, X and Y are independent.
General Case
About the without loss of generality clause above, if X and Y were distributed otherwise, let's say, for a<b and c<d,
P(X=b)=pP(Y=d)=qP(X=b,Y=d)=r
then
X′ and
Y′ given by
X′=X−ab−aandY′=Y−cd−c
would be distributed just as characterized above, since
X=a⇔X′=0,X=b⇔X′=1,Y=c⇔Y′=0andY=d⇔Y′=1.
So
X and
Y are independent
if and only if X′ and
Y′ are independent.
Also, we would have
E(X′)E(Y′)E(X′Y′)Cov(X′,Y′)=E(X−ab−a)=E(X)−ab−a=E(Y−cd−c)=E(Y)−cd−c=E(X−ab−aY−cd−c)=E[(X−a)(Y−c)](b−a)(d−c)=E(XY−Xc−aY+ac)(b−a)(d−c)=E(XY)−cE(X)−aE(Y)+ac(b−a)(d−c)=E(X′Y′)−E(X′)E(Y′)=E(XY)−cE(X)−aE(Y)+ac(b−a)(d−c)−E(X)−ab−aE(Y)−cd−c=[E(XY)−cE(X)−aE(Y)+ac]−[E(X)−a][E(Y)−c](b−a)(d−c)=[E(XY)−cE(X)−aE(Y)+ac]−[E(X)E(Y)−cE(X)−aE(Y)+ac](b−a)(d−c)=E(XY)−E(X)E(Y)(b−a)(d−c)=1(b−a)(d−c)Cov(X,Y).
So
Cov(X,Y)=0 if and only Cov(X′,Y′)=0.
=D