Як би ви пояснили коваріантність тому, хто розуміє лише середину?


207

... припускаючи, що я в змозі інтуїтивно збільшити свої знання про дисперсію ( розуміння "дисперсії" ) або кажучи: це середня відстань значень даних від "середнього" - а оскільки дисперсія знаходиться у квадраті одиниць, беремо квадратний корінь, щоб зберегти одиниці однакові, і це називається стандартним відхиленням.

Припустимо, що це багато сформульовано і (сподіваємось) зрозуміло "приймачем". Тепер, що таке коваріація, і як би пояснити це простою англійською мовою без використання математичних термінів / формул? (Тобто, інтуїтивне пояснення.;)

Зверніть увагу: я знаю формули та математику, що стоїть за цією концепцією. Я хочу вміти «пояснити» те саме, що легко зрозуміти, не включаючи математику; тобто що означає "коваріація"?


1
@ Xi'an - "як" саме ви б визначили це за допомогою простої лінійної регресії ? Я дуже хотів би знати ...
Кандидат наук

3
Припускаючи , що у вас вже є ваші діаграми розсіювання двох змінних х проти у, з початком в точці (0,0), просто намалюйте дві лінії в точці х = середнє значення (х) ( по вертикалі) і у = середня (х) ( по горизонталі): використовуючи цю нову систему координат (походження є у (середнє (х), середнє (у)), поставте знак "+" у верхньому правому та нижньому лівому квадрантах, знак "-" у двох інших квадрантах; ви отримали знак коваріації, який, в основному, сказав @Peter . Масштабування одиниць x- і y (SD) призводить до більш інтерпретаційного резюме, про що йдеться у наступній нитці .
chl

@chl - Чи можете ви, будь ласка, опублікувати це як відповідь і, можливо, використовувати графіку, щоб зобразити це!
Кандидат

Я знайшов відео на цьому веб-сайті, щоб допомогти мені, оскільки я віддаю перевагу зображенням над абстрактними поясненнями. Веб-сайт із відео Конкретно це зображення :! [Тут введіть опис зображення ] ( i.stack.imgur.com/xGZFv.png )
Карл Моррісон

Відповіді:


374

Іноді ми можемо «поповнювати знання» незвичним чи іншим підходом. Я хотів би, щоб ця відповідь була доступною для дітей-садівників, а також повеселилась, тому всі вийдіть з вашими олівцями!

Давши парні дані, намалюйте їх розсіювач. (Молодшим школярам може знадобитися вчитель, щоб виготовити це для них. :-) Кожна пара точок , у цій ділянці визначає прямокутник: це найменший прямокутник, сторони якого паралельні до осі, що містять ці точки. Таким чином, точки знаходяться у верхньому правому та нижньому лівому кутах («позитивне» співвідношення), або вони знаходяться у верхньому лівому та нижньому правому кутах («негативне» співвідношення).(x,y)(xi,yi)(xj,yj)

Намалюйте всі можливі такі прямокутники. Пофарбуйте їх прозоро, зробивши позитивні прямокутники червоними (скажімо), а негативні прямокутники - «червоними» (синіми). У такий спосіб, де прямокутники перекриваються, їх кольори або посилюються, коли вони однакові (синій і синій, або червоний і червоний), або скасовуються, коли вони різні.

Позитивні та негативні прямокутники

( На цій ілюстрації позитивного (червоного) та негативного (синього) прямокутника перекриття повинно бути білим; на жаль, це програмне забезпечення не має справжнього "анти-червоного" кольору. Накладка сіра, тому темніє сюжет, але загалом чиста кількість червоного кольору є правильною. )

Тепер ми готові до пояснення коваріації.

Коваріація - це чиста кількість червоного на ділянці (трактування синього кольору як негативних значень).

Ось кілька прикладів із 32 бінормальними точками, отриманими з розподілів із заданими коваріаціями, упорядкованими від більшості негативних (найсильніших) до більшої позитивних (червоніших).

Коваріаційні сюжети, оновлено 2019 рік

Їх малюють на загальних осях, щоб зробити їх порівняльними. Прямокутники злегка окреслені, щоб допомогти вам їх бачити. Це оновлена ​​(2019) версія оригіналу: вона використовує програмне забезпечення, яке належним чином скасовує червоний та блакитний кольори у прямокутних перекриттях.

Виведемо деякі властивості коваріації. Розуміння цих властивостей буде доступне кожному, хто фактично намалював декілька прямокутників. :-)

  • Біліарність. Оскільки кількість червоного кольору залежить від розміру ділянки, коваріація прямо пропорційна шкалі на осі x та шкалі на осі y.

  • Кореляція. Коваріація збільшується, коли точки наближаються до похилої лінії вгору і зменшується, оскільки точки наближаються до похилої лінії вниз. Це тому, що в першому випадку більшість прямокутників є позитивними, а в другому - більшістю.

  • Зв'язок з лінійними асоціаціями. Оскільки нелінійні асоціації можуть створювати суміші позитивних і негативних прямокутників, вони призводять до непередбачуваних (і не дуже корисних) коваріацій. Лінійні асоціації можна повністю інтерпретувати за допомогою попередніх двох характеристик.

  • Чутливість до людей, що вижили. Геометрична зовнішня частина (одна точка, що стоїть подалі від маси) створить багато великих прямокутників у поєднанні з усіма іншими точками. Це лише може створити чисту позитивну чи негативну кількість червоного кольору в загальній картині.

До речі, це визначення коваріації відрізняється від звичайного лише універсальною константою пропорційності (незалежною від розміру набору даних). Математично нахилені не матимуть проблем з алгебраїчною демонстрацією того, що формула, наведена тут, завжди вдвічі перевищує звичайну коваріацію.


92
+1 Вау Це навіть працює для пояснення коваріації тим, хто вже думав, що знає, що це таке.
Аарон

7
+1 Мені дуже подобається читати вашу відповідь. Я намалюю кілька прямокутників, і дозволь моєму синові намалювати їх :)
chl

18
Тепер, якщо тільки всі вступні статистичні поняття можна було б представити студентам таким
виразним

4
Це прекрасно. І дуже дуже зрозуміло.
Бенджамін Мако Хілл

4
@fcoppens Дійсно, існує традиційне пояснення, яке відбувається як ви пропонуєте. Я подумав про це, тому що не хотів вводити зайву ідею, а саме - побудувати центроїд . Це зробило б пояснення недоступним для п’ятирічки з коробкою олівців. Деякі з висновків, які я зробив наприкінці, теж не були негайними. Наприклад, це вже не буде настільки очевидним, що коваріація чутлива до певних видів переживачів. (x¯,y¯)
whuber

61

Для детального пояснення свого коментаря я вчив коваріації як міри (середньої) спів-варіації між двома змінними, скажімо, і .xy

Корисно згадати основну формулу (просту для пояснення, не потрібно говорити про математичні тривалості для вступного курсу):

cov(x,y)=1ni=1n(xix¯)(yiy¯)

щоб ми чітко бачили, що кожне спостереження може позитивно чи негативно сприяти коваріації залежно від добутку їх відхилення від середнього значення двох змінних та . Зауважте, що я не кажу тут про величину, а просто про ознаку внеску i-го спостереження.(xi,yi)x¯y¯

Це те, що я зобразив на наступних схемах. Штучні дані були створені за допомогою лінійної моделі (ліворуч, ; праворуч, , де були з гауссового розподілу з нульовим середнім значенням і , і від рівномірного розподілу на проміжку ).y=1.2x+εy=0.1x+εεSD=2x[0,20]

введіть тут опис зображення

Вертикальні та горизонтальні смуги представляють середнє значення та відповідно. Це означає, що замість "перегляду окремих спостережень" з походження ми можемо це зробити з . Це просто означає переклад на осі x і y. У цій новій системі координат кожне спостереження, розташоване у верхньому правому або нижньому лівому квадранті, позитивно сприяє коваріації, тоді як спостереження, розташовані в двох інших квадрантах, сприяють цьому негативно. У першому випадку (зліва) коваріація дорівнює 30.11, а розподіл у чотирьох квадрантах наведено нижче:xy(0,0)(x¯,y¯)

   +  -
+ 30  2
-  0 28

Зрозуміло, що коли значення вище їх середнього значення, то зробіть відповідні (wrt. ). Око-сальники форми 2D хмара точок, коли значення збільшення значення , як правило , теж зростає. (Але пам’ятайте, ми могли б також використати той факт, що між коваріацією та нахилом лінії регресії існує чітка залежність, тобто .)xiyiy¯xyb=Cov(x,y)/Var(x)

У другому випадку (справа, той самий ) коваріація дорівнює 3,54, а розподіл по квадрантах є більш "однорідним", як показано нижче:xi

   +  -
+ 18 14
- 12 16

Іншими словами, існує збільшена кількість випадків, коли 'і ' не коваріють в одному напрямку wrt. їхні засоби.xiyi

Зауважте, що ми могли б зменшити коваріацію шляхом масштабування або чи . На лівій панелі коваріація (або ) зменшується на десять разів (3.01). Оскільки одиниці вимірювання та поширення і (відносно їхніх засобів) ускладнюють інтерпретацію значення коваріації в абсолютних величинах, ми зазвичай масштабуємо обидві змінні за їх стандартними відхиленнями і отримуємо коефіцієнт кореляції. Це означає, що крім перецентрування нашого розсіювача наy ( x / 10 , y ) ( x , y / 10 ) x y ( x , y ) ( ˉ x , ˉ y ) x yxy(x/10,y)(x,y/10)xy(x,y)(x¯,y¯)ми також масштабуємо одиницю x- і y з точки зору стандартного відхилення, що призводить до більш інтерпретованої міри лінійної коваріації між і .xy


27

Коваріація - це міра того, наскільки одна змінна піднімається вгору, коли інша йде вгору.


1
Чи завжди в одному і тому ж напрямку? Також, чи застосовується це і для зворотних відносин (тобто, коли одна йде вгору, інша знижується)?
Кандидат наук

4
@nupul Добре, що протилежне "вгору" - "вниз", а протилежне "позитивному" - "негатив". Я спробував дати відповідь в одному реченні. Ваш набагато повніший. Навіть ваше "як дві змінні змінюються разом" є більш повним, але, я думаю, трохи складніше зрозуміти.
Пітер Флом

1
+1 за пристосування його до одного простого речення, але чи не це співвідношення? Я маю на увазі, я знаю більше cov => більший corr, але з цим реченням я б очікував чогось типу "80%" як відповідь, що відповідає corr = 0,8. Чи не також cov описує дисперсію в даних? тобто. "Коваріація пропорційна тому, наскільки одна змінна піднімається вгору, коли інша йде вгору, а також пропорційна поширенню даних в обох змінних", чи щось?
naught101

4
Правильно, Пітер, тому @ naught101 зробив цей коментар: ти опис звучить як швидкість зміни, одиниці якої, таким чином, будуть [одиниці однієї змінної] / [одиниці іншої змінної] (якщо ми інтерпретуємо це як похідну ) або просто буде [одиниці однієї змінної] (якщо інтерпретувати як чисту різницю). Це ні коваріація (одиниця виміру якої є добуток одиниць для двох змінних), ні кореляція (яка не є одиничною).
whuber

1
@nbro Розглянемо будь-який конкретний приклад: припустимо, ви знаєте, наприклад, коваріація змінних і дорівнює . Навіть, маючи найбільш щедре розуміння "змінної" та "підйому вгору", ви могли б сказати лише з цієї інформації, на скільки піднімається, коли збільшується на задану суму? Відповідь - ні: єдина інформація, яку ви даєте, - це те, що має тенденцію до зростання. У цій публікації Пітер плутав коваріацію з коефіцієнтом регресії (їх, до речі, два, і вони зазвичай різні). Y 1 , Y X YXY1,YXY
whuber

12

Я маю в відповідь на мій власний питання, але я думав , що це було б здорово для людей , які приїжджають на цей пост , щоб перевірити деякі з пояснень на цій сторінці .

Я перефразую одну з дуже чітко сформульованих відповідей (користувачем 'Zhop'). Я роблю це в тому випадку, якщо цей веб-сайт закривається або його знімають, коли хтось із цього часу отримує доступ до цієї публікації;)

Коваріація - це міра того, наскільки дві змінні змінюються разом. Порівняйте це з Варіантом - це лише діапазон, за який змінюється одна міра (або змінна).

Вивчаючи соціальні зразки, ви можете висунути гіпотезу, що заможніші люди, ймовірно, будуть більш освіченими, тому ви спробуєте побачити, наскільки ретельно вимірюють багатство та освіту. Ви б використали міру коваріації для визначення цього.

...

Я не впевнений, що ви маєте на увазі, коли ви запитуєте, як це стосується статистики. Це одна міра, яку вивчають у багатьох класи статистики. Ви мали на увазі, коли ви повинні його використовувати?

Ви використовуєте його, коли хочете побачити, наскільки дві чи більше змінних змінюються відносно один одного.

Подумайте про людей у ​​команді. Подивіться, як вони різняться за географічним розташуванням порівняно один з одним. Коли команда грає або тренується, відстань між окремими членами дуже мала, і ми б сказали, що вони знаходяться в одному місці. І коли їх місце розташування змінюється, воно змінюється для всіх людей разом (скажімо, поїздки в автобусі на гру). У цій ситуації ми б сказали, що вони мають високий рівень коваріації. Але коли вони не грають, то коефіцієнт коваріації, ймовірно, буде досить низьким, оскільки всі вони ходять в різні місця з різною швидкістю.

Таким чином, ви можете передбачити місце розташування одного члена команди, виходячи з місця розташування іншого члена команди, коли він тренується або грає в гру з високим ступенем точності. Я вважаю, що вимірювання коваріації буде близьким до 1. Але коли вони не тренуються і не грають, у вас буде набагато менший шанс передбачити місце розташування однієї людини, виходячи з місця розташування члена команди. Це, мабуть, буде близьким до нуля, хоча і не до нуля, оскільки іноді члени команди будуть друзями та можуть разом поїхати місцями разом.

Однак якщо ви вибрали випадковим чином людей у ​​Сполучених Штатах і спробували використати одного з них, щоб передбачити місце розташування інших, ви, мабуть, виявили, що коваріація дорівнює нулю. Іншими словами, абсолютно не існує зв'язку між місцезнаходженням однієї випадково вибраної людини в США та іншим.

Додавання ще одного (від "CatofGrey"), який допомагає посилити інтуїцію:

У теорії ймовірностей та статистиці коваріація - це міра того, наскільки дві випадкові величини різняться разом (на відміну від дисперсії, яка вимірює, наскільки змінюється одна змінна).

Якщо дві змінні, як правило, різняться разом (тобто коли одна з них перевищує очікувану величину, то інша змінна також має значення вище її очікуваного значення), тоді коваріація між двома змінними буде позитивною. З іншого боку, якщо одна з них перевищує очікувану величину, а інша змінна, як правило, нижче її очікуваного значення, то коваріація між двома змінними буде негативною.

Ці двоє разом змусили мене зрозуміти коваріантність, як я ніколи цього не розумів! Просто дивовижно!!


15
Хоча ці описи є якісно сугестивними, вони, на жаль, є неповними: вони ні відрізняють коваріацію від кореляції (перший опис, як видається, плутає ці два, насправді), а також не виводять фундаментального припущення про лінійну спів-варіацію. Також жоден з них не стосується важливого аспекту, що коваріація залежить (лінійно) від масштабу кожної змінної.
whuber

@whuber - погодився! І, отже, не позначили мою відповідь :) (поки не;)
Кандидат

12

Мені дуже подобається відповідь Вюбера, тому я зібрав ще трохи ресурсів. Коваріація описує як далеко поширені змінні, так і характер їх взаємозв'язку.

Коваріація використовує прямокутники, щоб описати, наскільки далеко знаходиться спостереження від середнього на графіку розкидання:

  • Якщо прямокутник має довгі сторони та велику ширину або короткі сторони та коротку ширину, це свідчить про те, що дві змінні рухаються разом.

  • Якщо у прямокутника є дві сторони, відносно довгі для цих змінних, і дві сторони, відносно короткі для іншої змінної, це спостереження дає свідчення, що змінні не рухаються разом.

  • Якщо прямокутник знаходиться у 2-му чи 4-му квадранті, то коли одна змінна більша за середню, інша менша від середньої. Збільшення однієї змінної пов'язане зі зменшенням іншої.

Я знайшов класну візуалізацію цього на http://sciguides.com/guides/covariance/ , Він пояснює, що таке коваріація, якщо ви просто знаєте середню.


7
+1 Приємне пояснення (особливо це вступне односкладне резюме). Посилання цікава. Оскільки він не має архіву на машині Wayback, він, ймовірно, є новим. Оскільки це так суперечить моїй (трирічній) відповіді, аж до вибору червоного для позитивного та синього для негативних стосунків, я підозрюю, що це (нерозподілене) похідне матеріалу на цьому веб-сайті.
whuber

4
Посилання "крута візуалізація" загинула ....
whuber

1
@MSIS Це неможливо зрозуміти, оскільки існує дуже велика кількість можливих розподілів по колу. Але якщо ви маєте на увазі рівномірний розподіл, нічого обчислити немає, тому що (як я пам'ятаю зауваження у вашій нитці на stats.stackexchange.com/q/414365/919 ) коефіцієнт кореляції повинен дорівнювати власному негативному, QED.
whuber

1
XX0XX2X1,XX2:11
whuber

1
α,a<αb((ba)mod2π)/(2π).

10

Ось ще одна спроба пояснити коваріацію малюнком. Кожна панель на малюнку нижче містить 50 точок, змодельованих з біваріантного розподілу з кореляцією між x & y 0,8 та варіаціями, як показано на мітках рядків та стовпців. Коваріація показана в правому нижньому куті кожної панелі.

Різні коваріації, всі з кореляцією = 0,8

Усі, хто зацікавлений в поліпшенні цього ... ось код R:

library(mvtnorm)

rowvars <- colvars <- c(10,20,30,40,50)

all <- NULL
for(i in 1:length(colvars)){
  colvar <- colvars[i]
  for(j in 1:length(rowvars)){
    set.seed(303)  # Put seed here to show same data in each panel
    rowvar <- rowvars[j]
    # Simulate 50 points, corr=0.8
    sig <- matrix(c(rowvar, .8*sqrt(rowvar)*sqrt(colvar), .8*sqrt(rowvar)*sqrt(colvar), colvar), nrow=2)
    yy <- rmvnorm(50, mean=c(0,0), sig)
    dati <- data.frame(i=i, j=j, colvar=colvar, rowvar=rowvar, covar=.8*sqrt(rowvar)*sqrt(colvar), yy)
    all <- rbind(all, dati)
  }
}
names(all) <- c('i','j','colvar','rowvar','covar','x','y')
all <- transform(all, colvar=factor(colvar), rowvar=factor(rowvar))
library(latticeExtra)
useOuterStrips(xyplot(y~x|colvar*rowvar, all, cov=all$covar,
                      panel=function(x,y,subscripts, cov,...){
                        panel.xyplot(x,y,...)
                        print(cor(x,y))
                        ltext(14,-12, round(cov[subscripts][1],0))
                      }))

10

Мені сподобалася відповідь @whuber - раніше у мене було лише розпливчасте уявлення про те, як можна візуалізувати коваріацію, але ці ділянки прямокутника геніальні.

Однак оскільки формула коваріації передбачає середнє значення, а в початковому запитанні ОП було вказано, що "приймач" розуміє поняття середнього, я подумав, що у мене виникне тріщина при адаптації прямокутника ділянок прямокутника @ whuber для порівняння кожної точки даних з засоби x і y, оскільки це більше відображає те, що відбувається у формулі коваріації. Я думав, що насправді це виглядає досить інтуїтивно: "Графіки коваріації для змінних з різною кореляцією"

Синя крапка в середині кожного сюжету - це середнє значення x (x_mean) та середнє значення y (y_mean).

Прямокутники порівнюють значення x - x_mean та y - y_mean для кожної точки даних.

Прямокутник зелений, якщо:

  • і x, і y більше, ніж їх відповідні засоби
  • і x, і y менше, ніж їх відповідні засоби

Прямокутник червоний, якщо:

  • x більше x_mean, але y менше y_mean
  • x менше x_mean, але y більше y_mean

Коваріація (і кореляція) може бути як сильно негативною, так і сильно позитивною. Коли в графіку переважає один колір більше, ніж інший, це означає, що дані здебільшого мають послідовну схему.

  • Якщо графік має набагато більше зеленого, ніж червоного, це означає, що y, як правило, збільшується при збільшенні х.
  • Якщо графік має набагато більше червоного, ніж зеленого, це означає, що y зазвичай зменшується, коли х збільшується.
  • Якщо в графіку не переважає один чи інший колір, це означає, що не так багато шаблону, як х і у співвідносяться один з одним.

Фактичне значення коваріації для двох різних змінних x і y, в основному, є сумою всієї зеленої площі за мінусом усієї червоної площі, потім ділиться на загальну кількість точок даних - фактично середня зелена-проти-почервоніння графіка .

Як це звучить / виглядає?


3

Варіантність - ступінь, в якій випадкова довільна зміна щодо її очікуваного значення Внаслідок стохастичної природи основного процесу, яку представляє випадкова величина.

Коваріація - це ступінь, коли дві різні випадкові величини змінюються відносно один одного. Це може статися, коли випадкові змінні керуються тим самим основним процесом або його похідними. Або процеси, представлені цими випадковими змінними, впливають один на одного, або це той самий процес, але одна з випадкових змінних походить від іншої.


2

Я б просто пояснив кореляцію, яка є досить інтуїтивно зрозумілою. Я б сказав, "Кореляція вимірює міцність взаємозв'язку між двома змінними X і Y. Кореляція між -1 і 1 і буде близькою до 1 за абсолютною величиною, коли зв'язок є сильним. Коваріація - це лише кореляція, помножена на стандартні відхилення дві змінні. Отже, хоча кореляція є безрозмірною, коваріація є у добутку одиниць для змінної X та змінної Y.


10
Це здається неадекватним, оскільки немає згадок про лінійність. X і Y можуть мати сильну квадратичну залежність, але мати кореляцію нуля.
mark999

0

Дві змінні, які мали б високу позитивну коваріацію (кореляцію), - це кількість людей у ​​кімнаті та кількість пальців, які знаходяться в кімнаті. (Зі збільшенням кількості людей ми також очікуємо, що кількість пальців збільшиться.)

Щось, що може мати негативну коваріацію (кореляцію), - це вік людини та кількість волосяних фолікулів на голові. Або кількість зіт на обличчі людини (у певній віковій групі) та кількість побачень у них за тиждень. Ми очікуємо, що люди, які мають більше років, мають менше волосся, а люди, які мають більше прищів, мають менше побачень. Це негативно корелює.


2
Коваріація не обов'язково взаємозамінна з кореляцією - перша залежить від одиниці. Кореляція - це число від -1 до 1 скаляр без одиниць, що представляє "силу" коваріаційного IMO, і це не зрозуміло з вашої відповіді
кандидат наук

Як відповідь, яка відповідає, означає, що коваріацію та кореляцію можна використовувати взаємозамінно.
sapo_cosmico
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.