Що таке коваріація простою мовою?


92

Що таке коваріація простою мовою, і як вона пов'язана із термінами залежність , кореляція та дисперсія-коваріаційна структура стосовно проектів повторних заходів?


Відповіді:


82

Коваріація - це міра того, як зміни однієї змінної пов'язані зі змінами другої змінної. Зокрема, коваріація вимірює ступінь, до якого дві змінні лінійно пов'язані. Однак він також неофіційно використовується як загальний показник того, наскільки монотонно пов'язані дві змінні. Є багато корисних інтуїтивних пояснень ковариации тут .

Що стосується того, як коваріація пов'язана з кожним із згаданих вами термінів:

(1) Кореляція - це масштабована версія коваріації, яка приймає значення в з кореляцією вказує на ідеальну лінійну асоціацію та вказує на відсутність лінійної залежності. Це масштабування робить кореляцію інваріантною щодо зміни масштабу вихідних змінних (на що вказує Акавал і наводить приклад +1). Константа масштабування є добутком стандартних відхилень двох змінних. [1,1]±10

(2) Якщо дві змінні незалежні , їх коваріація дорівнює . Але наявність коваріації не означає, що змінні є незалежними. Ця цифра (з Вікіпедії)00

                введіть тут опис зображення

показано кілька прикладних графіків даних, які не є незалежними, але їхнє коваріації дорівнює . Одним важливим особливим випадком є ​​те, що якщо дві змінні зазвичай розподіляються разом , то вони є незалежними, якщо і лише якщо вони не співвідносяться . Інший особливий випадок полягає в тому, що пари змінних Бернуллі є некорельованими, якщо і лише якщо вони незалежні (спасибі @cardinal).0

(3) / структура ковариации дисперсії (часто називають просто ковариационную структуру ) в повторних вимірах конструкцій відноситься до структури , яка використовується для моделювання того факту , що повторних вимірювання на обличчях , потенційно корелюють (і , отже , залежні) - це робиться шляхом моделювання записи в коваріаційну матрицю повторних вимірювань. Одним із прикладів є змінна кореляційна структура з постійною дисперсією, яка визначає, що кожне повторне вимірювання має однакову дисперсію, і всі пари вимірювань однаково співвідносні. Кращим вибором може бути визначення структури коваріації, яка вимагає двох вимірів, проведених далі, щоб бути менш співвіднесеними (наприклад,авторегресивна модель ). Зауважимо, що термін коваріаційна структура виникає більш загально в багатьох видах багатоваріантних аналізів, де спостереження дозволяють співвідносити.


2
ваше пояснення приємне. За нею йде цінна добавка, яка викликала цікаву серію коментарів. Дякую всім :)!
стан

23

Відповідь Макроса відмінна, але я хочу додати більше до того, як коваріація пов'язана з кореляцією. Коваріація насправді не говорить вам про міцність взаємозв'язку між двома змінними, в той час як кореляція це робить. Наприклад:

x = [1, 2, 3]
y = [4, 6, 10]

cov(x,y) = 2 #I am using population covariance here

Тепер змінимо шкалу і помножимо і x, і y на 10

x = [10, 20, 30]
y = [40, 60, 100]

cov(x, y) = 200

Зміна шкали не повинно збільшувати силу взаємозв'язку, тому ми можемо відрегулювати ділення коваріацій на стандартні відхилення на x і y, що є саме визначенням коефіцієнта кореляції.

В обох вищезазначених випадках коефіцієнт кореляції між x і y дорівнює 0.98198.


6
"Коваріація насправді не говорить вам про міцність взаємозв'язку між двома змінними, в той час як кореляція це робить." Це твердження є абсолютно хибним. Дві міри є однаковими за шкалою модуля за двома стандартними відхиленнями.
Девід Геффернан

15
@DavidHeffernan, так, якщо масштабувати стандартними відхиленнями, то коваріація говорить нам про силу відносин. Однак міра коваріації сама собою не говорить про це.
Акавал

10
@DavidHeffernan, я думаю, що говорить Акавал: якщо ви не знаєте масштабу змінних, то коваріація нічого не скаже про силу відносин - інтерпретувати можна лише знак.
Макрос

6
У якій практичній ситуації можна отримати коваріацію, не маючи змоги отримати також хорошу оцінку шкали змінних?
Девід Геффернан

7
Однак не завжди потрібно знати стандартне відхилення, щоб зрозуміти масштаб змінної і, таким чином, силу відношення. Нестандартні ефекти часто носять інформативний характер. Наприклад, якщо навчання на курсах призводить до того, що люди в середньому збільшують дохід на 10 000 доларів на рік, це, мабуть, кращий показник сили ефекту, ніж твердження, що між курсом і доходом існує ар = .34 кореляція.
Джеромі Англім
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.