Чому Pearson ρ є лише вичерпною мірою асоціації, якщо спільний розподіл є багатоваріантним нормальним?


16

Це твердження було піднято в найкращій відповіді на це питання . Я вважаю, що питання "чому" є досить різним, що воно вимагає нової нитки. Гуглінг "вичерпний захід асоціації" не спричинив жодного хіта, і я не впевнений, що ця фраза означає.

Відповіді:


15

Можливо, найкраще розуміти "міру асоціації" у багатофакторному розподілі, що складається з усіх властивостей, які залишаються однаковими, коли значення довільно змінюються і переглядаються. Це може змінити засоби та відхилення на будь-які теоретично допустимі значення (відхилення повинні бути позитивними; засоби можуть бути будь-якими).

Коефіцієнти кореляції ("Pearson's ") тоді повністю визначають багатоваріантне нормальне розподіл. Один із способів побачити це - подивитися на будь-яке формулярне визначення, наприклад формули для функції густини або характеристичної функції. Вони передбачають лише засоби, відхилення та коваріації, але коваріації та кореляції можна вивести одне від одного, коли ви знаєте відхилення.ρ

Багатоваріантна нормальна сім'я - не єдина родина розповсюджених, яка користується цією властивістю. Наприклад, будь-яке багатоваріантне t розподіл (для ступенів свободи, що перевищує ) має чітко визначену кореляційну матрицю і повністю визначається також її першими двома моментами.2


Я правий, що згідно з визначенням, яке ви тут застосовуєте, коваріація не була б мірою асоціації? Оскільки воно буде схильне до розширення у міру розширення дисперсій.
user1205901

2
Це правильно. Хоча коваріація, очевидно, пов'язана з мірою асоціації, вона сама по собі не є такою, оскільки на неї впливають і інші фактори.
whuber

19

Варіанти можуть бути пов'язані таким чином, щоб кореляція Пірсона була абсолютно сліпою.

ρхуz

введіть тут опис зображення

Ось ще один приклад пов’язаних, але некорельованих змінних:

введіть тут опис зображення

(Основний момент робиться щодо розподілів, хоча я ілюструю це даними тут.)

Навіть коли співвідносяться між змінними, співвідношення Пірсона взагалі не говорить вам про те, як ви можете отримати дуже різні форми асоціації, які мають однакову кореляцію Пірсона, (але коли змінні є багатовимірними нормальними, як тільки я вам кажу співвідношення можна точно сказати, як пов'язані стандартизовані змінні).

ρ

(Поширений спосіб вирішити багатоваріантну асоціацію - через копули. На сайті є чимало питань, що стосуються копул; деякі з них можуть бути корисними)


Чи є дані з реального світу з такими розподілами?

@what Чи існують дані реального світу навіть із звичайних розподілів? Я сумніваюся в цьому, тому (оскільки мої поля були нормальними на діаграмах), що відповідь "ні" негайно зробить. Суть прикладів полягала в тому, щоб чітко показати, чому асоціація між випадковими змінними не є такою простою, як іноді передбачається (як часто люди обчислюють кореляцію Пірсона для вимірювання асоціації? Досить часто), а також зазначити, що мати нормальну маржу та бути багатоваріантною. нормальні різні. Звичайно трапляються дуже реальні приклади, коли співвідношення Пірсона не фіксує те, що відбувається.
Glen_b -Встановити Моніку

Давайте ні на хвилину не поговоримо про розподіли. Коли ми обчислюємо кореляції з точкової хмари, ми припускаємо, що лежить в основі "геометрично форми" (лінійна, гіперболічна, логарифмічна, синусова тощо) ідеальна кореляція, від якої точки в хмарі відхиляються через деяку "помилку". Тепер усі ідеальні фігури, які я бачив, абстрагувались від реальних даних, де безперервні (без перерв) і завжди збільшуються принаймні по одній осі (тобто, наприклад, круговій). Мої знання про дані обмежені, тому мені було цікаво, чи існують насправді реальні дані, кореляція яких є безперервним або круговим.

Наприклад, можуть бути дані, що якщо я буду графік, він буде схожий на дві хмари точки. Якщо я сліпо обчислюю кореляції цих даних, я можу знайти їх, тоді як (або мені так мені сказали) сюжет чітко вказує на те, що мені не вистачає якоїсь невідомої змішувальної змінної, яка, якби я її врахувала, вирішила б помилкові відносини в моєму дані. Якби мій професор переглянув ваші приклади у формі «х» чи «у», він сказав би мені, що у мене є дві різні підмножини даних.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.