Що таке коваріація простою мовою, і як вона пов'язана із термінами залежність , кореляція та дисперсія-коваріаційна структура стосовно проектів повторних заходів?
Що таке коваріація простою мовою, і як вона пов'язана із термінами залежність , кореляція та дисперсія-коваріаційна структура стосовно проектів повторних заходів?
Відповіді:
Коваріація - це міра того, як зміни однієї змінної пов'язані зі змінами другої змінної. Зокрема, коваріація вимірює ступінь, до якого дві змінні лінійно пов'язані. Однак він також неофіційно використовується як загальний показник того, наскільки монотонно пов'язані дві змінні. Є багато корисних інтуїтивних пояснень ковариации тут .
Що стосується того, як коваріація пов'язана з кожним із згаданих вами термінів:
(1) Кореляція - це масштабована версія коваріації, яка приймає значення в з кореляцією вказує на ідеальну лінійну асоціацію та вказує на відсутність лінійної залежності. Це масштабування робить кореляцію інваріантною щодо зміни масштабу вихідних змінних (на що вказує Акавал і наводить приклад +1). Константа масштабування є добутком стандартних відхилень двох змінних.
(2) Якщо дві змінні незалежні , їх коваріація дорівнює . Але наявність коваріації не означає, що змінні є незалежними. Ця цифра (з Вікіпедії)
показано кілька прикладних графіків даних, які не є незалежними, але їхнє коваріації дорівнює . Одним важливим особливим випадком є те, що якщо дві змінні зазвичай розподіляються разом , то вони є незалежними, якщо і лише якщо вони не співвідносяться . Інший особливий випадок полягає в тому, що пари змінних Бернуллі є некорельованими, якщо і лише якщо вони незалежні (спасибі @cardinal).
(3) / структура ковариации дисперсії (часто називають просто ковариационную структуру ) в повторних вимірах конструкцій відноситься до структури , яка використовується для моделювання того факту , що повторних вимірювання на обличчях , потенційно корелюють (і , отже , залежні) - це робиться шляхом моделювання записи в коваріаційну матрицю повторних вимірювань. Одним із прикладів є змінна кореляційна структура з постійною дисперсією, яка визначає, що кожне повторне вимірювання має однакову дисперсію, і всі пари вимірювань однаково співвідносні. Кращим вибором може бути визначення структури коваріації, яка вимагає двох вимірів, проведених далі, щоб бути менш співвіднесеними (наприклад,авторегресивна модель ). Зауважимо, що термін коваріаційна структура виникає більш загально в багатьох видах багатоваріантних аналізів, де спостереження дозволяють співвідносити.
Відповідь Макроса відмінна, але я хочу додати більше до того, як коваріація пов'язана з кореляцією. Коваріація насправді не говорить вам про міцність взаємозв'язку між двома змінними, в той час як кореляція це робить. Наприклад:
x = [1, 2, 3]
y = [4, 6, 10]
cov(x,y) = 2 #I am using population covariance here
Тепер змінимо шкалу і помножимо і x, і y на 10
x = [10, 20, 30]
y = [40, 60, 100]
cov(x, y) = 200
Зміна шкали не повинно збільшувати силу взаємозв'язку, тому ми можемо відрегулювати ділення коваріацій на стандартні відхилення на x і y, що є саме визначенням коефіцієнта кореляції.
В обох вищезазначених випадках коефіцієнт кореляції між x і y дорівнює 0.98198
.