Чи може хтось проілюструвати, як може бути залежність і нульова коваріація?


12

Чи може хтось проілюструвати, як це робить Грег, але більш детально, як випадкові змінні можуть залежати, але мають нульову коваріацію? Грег, тут плакат, наводить приклад, використовуючи тут коло .

Чи може хтось пояснити цей процес більш детально, використовуючи послідовність етапів, які ілюструють процес на декількох етапах?

Крім того, якщо ви знаєте приклад з психології, будь ласка, проілюструйте цю концепцію відповідним прикладом. Будьте дуже точні та послідовні у своєму поясненні, а також зазначте, які можуть бути наслідки.


Посилання на статтю, на яку ви посилаєтесь, допоможе.
gui11aume

1
Я впевнений, що тема тут: stats.stackexchange.com/questions/12842/…, а відповідь Грега (Снігу) тут: stats.stackexchange.com/a/12898/2073
Енді Маккензі

Спочатку я вважав, що закриття цього питання було правильним, але я думаю, що, можливо, він задає дещо інше запитання звідси stats.stackexchange.com/questions/12842/…, оскільки цей потік просто попросив математичні приклади, в той час як це питання шукає розуміння саме чому обидва не рівноцінні
Макрос

Відповіді:


21

Основна ідея тут полягає в тому, що коваріація вимірює лише один конкретний тип залежності , тому дві не є рівнозначними. Зокрема,

  • Коваріація - це міра того, наскільки лінійно пов'язані дві змінні. Якщо дві змінні нелінійно пов'язані, це не відображатиметься в коваріації. Більш детальний опис можна знайти тут .

  • Залежність між випадковими змінними відноситься до будь-якого типу відносин між цими двома, що змушує їх діяти інакше «разом», ніж вони «самі по собі». Зокрема, залежність між випадковими змінними поглинає будь-які відносини між цими, що спричиняють їх спільний розподіл не продуктом їх граничних розподілів. Сюди входять лінійні відносини, а також багато інших.

  • Якщо дві змінні нелінійно пов'язані, вони потенційно можуть мати 0 коваріації, але все ще залежать - тут наводиться багато прикладів, і цей графік нижче з Вікіпедії дає кілька графічних прикладів у нижньому рядку:

    введіть тут опис зображення

  • Одним із прикладів, коли нульова коваріація та незалежність між випадковими змінними є еквівалентними умовами, - коли змінні спільно нормально розподіляються (тобто обидві змінні дотримуються двовимірного нормального розподілу , що не еквівалентно двом змінним, які нормально розподіляються). Інший особливий випадок полягає в тому, що пари змінних Бернуллі є некорельованими тоді і лише тоді, коли вони є незалежними (спасибі @cardinal). Але в цілому обидва не можна вважати рівнозначними.

Тому взагалі не можна зробити висновок, що дві змінні є незалежними лише тому, що вони виявляються некорельованими (наприклад, не пропустили нульову гіпотезу про відсутність кореляції). Одно добре радити побудувати дані, щоб зробити висновок про те, що вони пов'язані між собою, а не просто зупинятися на тесті кореляції. Наприклад, (спасибі @gung), якщо потрібно запустити лінійну регресію (тобто тестування на ненульову кореляцію) і виявити несуттєвий результат, можна спробувати зробити висновок, що змінні не пов'язані між собою, але ви ' Я досліджував лише лінійний взаємозв'язок.

Я мало знаю про психологію, але має сенс, що там можуть бути нелінійні зв’язки між змінними. Як приклад іграшки, мабуть, можливо, що пізнавальна здатність нелінійно пов'язана з віком - дуже молоді та дуже старі люди не такі гострі, як 30-річна. Якби було побудувати якусь міру когнітивної абляції та віку, можна очікувати, що когнітивна здатність є найвищою у помірному віці і занепадає навколо цього, що було б нелінійною схемою.


1
Просто бічне ( педантичне ?! ) зауваження, але випадкові змінні Бернуллі є незалежними лише тоді, якщо вони є некорельованими. :)
кардинал

@cardinal, не хвилюйся, що я просто знову відмовляюся від раціональності, як, наприклад, коли ти сказав, що багатоваріантний нормал з сингулярною коваріаційною матрицею "широко використовується і статистично актуальний".
Макрос

Наступного разу, коли я буду в Ен-Арбор, я куплю вам каву, щоб спробувати компенсувати цей жарт. :) Не соромтеся тим часом сумніватися в моїй раціональності. :)
кардинал

Ах, але це останнє цитування правдиве . ;-) Це з'являється в деяких дивно поширених місцях. :) (Хоча це тут трохи поза темою.)
кардинал

(+1) Мені було за думкою про те, чи варто це питання закрити як дублікат чи ні. Але я думаю, що хороші відповіді можуть поставити дуже схожі питання, яких варто дотримуватися. Маючи все перехресно, це допомагає.
кардинал

7

Стандартним способом викладання / візуалізації кореляції чи коваріації є побудова даних, прорисування ліній середнім значенням «x» та «y», а потім малювання прямокутників від точки 2 засобів до окремих точок даних, наприклад:

введіть тут опис зображення

Прямокутники (точки) у верхньому правому та нижньому лівому квадрантах (червоний у прикладі) вносять позитивні значення у кореляцію / коваріацію, тоді як прямокутники (точки) у верхньому лівому та нижньому правому квадрантах (синій у прикладі) вносять від'ємні значення значення кореляції / коваріації. Якщо загальна площа червоних прямокутників дорівнює загальній площі синіх прямокутників, то позитиви та негативи скасовуються, і ви отримуєте нульову коваріацію. Якщо в червоному є більше площі, то коваріація буде позитивною, а якщо в синьому кольорі більше, то коваріація буде негативною.

Тепер розглянемо приклад з попереднього обговорення:

введіть тут опис зображення

Окремі точки слідують за параболою, тому вони залежні, якщо ви знаєте "x", то ви точно знаєте "y", але ви також можете бачити, що для кожного червоного прямокутника є відповідний синій прямокутник, тому остаточна коваріація буде 0 .


(+1) Чи є Rпакет, який робить ці сюжети (я пригадую, як колись відображав такий сюжет) чи ти це робив з нуля?
Макрос

@Macro, гарне запитання, хоча я думаю, що події були зроблені в Mathematica. Це легко зробити "вручну" в R за допомогою polygonабо rectта пристрою, який підтримує прозорість альфа.
кардинал

Я написав функцію робити цей сюжет і, ймовірно, незабаром додасть його в TeachingDemosпакет. Моя перша думка полягала в тому, щоб скоротити фразу «кореляційні прямокутники» до «виправити» як назву функції, а потім трохи зрозумівши, що ім’я може бути легко зрозумілим, як робити щось зовсім інше. Тому мені потрібно придумати краще ім’я, додати кілька варіантів і завантажити його в R-Forge.
Грег Сніг,

3

Один простий тест, якщо це, якщо дані в основному слідують за схемою, симетричною навколо вертикальної або горизонтальної осі через засоби, ко-дисперсія буде досить близькою до нуля. Наприклад, якщо симетрія знаходиться навколо осі y, це означає, що для кожного значення з заданим y існує додатна різниця x від середнього x та від'ємна різниця від середнього x. Додавання y * x для цих значень буде дорівнює нулю. Ви можете це добре проілюструвати в колекції прикладних сюжетів в інших відповідях. Існують і інші зразки, які дають нульову ко-дисперсію, але не незалежність, але багато прикладів легко оцінюються, шукаючи симетричність чи ні.


1

Приклад з Вікіпедії :

"Якщо змінні незалежні, коефіцієнт кореляції Пірсона дорівнює 0, але зворотне не відповідає дійсності, оскільки коефіцієнт кореляції виявляє лише лінійні залежності між двома змінними. Наприклад, припустимо, що випадкова величина X симетрично розподілена приблизно до нуля, а Y = X ^ 2. Тоді Y повністю визначається X, так що X і Y є абсолютно залежними, але їх співвідношення дорівнює нулю; вони некорельовані. Однак у спеціальному випадку, коли X і Y є спільно нормальними, некорельованість рівнозначна незалежності ".

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.