Яка кореляція, якщо стандартне відхилення однієї змінної дорівнює 0?


15

Як я розумію, ми можемо отримати кореляцію, нормалізуючи коваріацію за допомогою рівняння

ρi,j=cov(Xi,Xj)σiσj

де - стандартне відхилення . Xiσi=E[(Xiμi)2]Xi

Мене хвилює те, що якщо стандартне відхилення дорівнює нулю? Чи є якась умова, яка гарантує, що вона не може бути нульовою?

Спасибі.


11
Жодна змінна, яка має стандартне відхилення 0, не може бути співвіднесена з іншою (непостійною) змінною. Кореляція - це міра того, наскільки великі / малі значення в одній змінній відповідають великим / малим значенням в іншій змінній - якщо одна із змінних дорівнює константі з ймовірністю 1 (наслідок наявності стандартного відхилення 0), то вона може ' t можливо, дайте інформацію про те, мала чи велика інша змінна. Я не знаю, що таке конвенція, але здається, що в цьому випадку кореляцію слід визначити як 0.
Макрос

Велике спасибі Макросу. Я думаю, що ваша ідея така ж, як відповідь нижче. Однак я не міг проголосувати ваш коментар через обмеження в балах. Спасибі.
чепуха

4
Ви вже прийняли відповідь, і тому я напишу лише коментар. Якщо випадкова величина має стандартне відхилення , то для будь-якої іншої випадкової величини (оскільки з вірогідністю ). Таким чином, визначення коефіцієнта кореляції надає невизначену форму . У цьому випадку умовно визначити рівним , і це можна захистити на підставі граничного значення якσ Y = 0 cov ( X , Y ) = E [ ( X - μ X ) ( Y - μ Y ) ] = 0 X ( Y - μ Y ) = 0 1 ρYσY=0
cov(X,Y)=E[(XμX)(YμY)]=0
X(YμY)=01 0ρX,Y=cov(X,Y)σXσY00 ρX,Y0ρX,YσY0 тощо
Діліп Сарват

6
@Dilip, якщо це відповідь, він повинен відповідати. Не має значення, чи відповідь вже прийнята.
Енді Ш

1
@Dilip Проблема форми полягає в тому, що навіть якщо за допомогою обмежувальної операції можна встановити певне значення, значення залежить від того, як ви приймаєте обмеження. Отже, аргумент про те, що є неповним (і непереконливим). Чи можете ви навести джерело, яке приймає цю конвенцію та підтримує її з поважною причиною? 00ρX,Y=0
whuber

Відповіді:


14

Це правда, що якщо один із ваших SD - 0, це рівняння не визначено. Однак, кращий спосіб подумати над цим - якщо один із ваших SD-кодів 0, кореляції немає. У розрізненому концептуальному плані співвідношення розповідає про те, як одна змінна рухається навколо, як рухається інша змінна. SD 0 означає, що змінна не 'рухається навколо'. Вам би довелося мати вектор константи, наприклад rep(constant, n_times).


Дуже дякую. Я думаю, що це має сенс. Цікаво, що я не бачив жодного підручника, щоб згадувати про цю справу.
чепуха

@gung Отже, це обмеження у визначенні коефіцієнта кореляції, я маю на увазі, що рівняння кореляції може мати два значення, одне як наведене в рівнянні вище, а 0, коли SD однієї зі змінних дорівнює 0.
прашант

@prashanth, я думаю.
gung - Відновіть Моніку

2

Інша річ, про яку слід подумати, - це основні припущення, коли ми говоримо про засоби та стандартні відхилення та кореляції.

Якщо ми говоримо про вибірку даних, одне поширене припущення полягає в тому, що дані (принаймні приблизно) нормально розподіляються або можуть бути перетворені таким чином, щоб вони були (наприклад, за допомогою перетворення журналу). Якщо ви спостерігаєте стандартне відхилення нуля, є два сценарії: або стандартне відхилення насправді є ненульовим, але дуже малим, і тому у набору даних у вас є вибірки, які знаходяться на середньому значенні (це могло б, наприклад, статися якщо ви вимірюєте дані з приблизним рівнем точності); або модель неправильно вказана.

У цьому другому сценарії стандартне відхилення, а отже, кореляція - це безглуздий захід.

Більш загально, основні розподіли повинні мати як кінцеві другі моменти, а отже, ненульові стандартні відхилення, щоб кореляція була дійсною концепцією.


Можливо, варто відзначити, що початкове питання стосується (теоретичних) розподілів, а не даних.
whuber

Якщо це так, то стандартне відхилення нуля означатиме вироджене розподіл із мірою лише за середнім значенням (тобто постійною функцією) ... знову ж таки, стандартне відхилення має сенс, що базовий розподіл є нормальним. Якщо стандартне відхилення дорівнює нулю, PDF Гаусса не визначений належним чином, а отже, не допустимий у моделі.
tdc

Я здивований появою гаусівців у вашому коментарі, Томе. Це здається зайвим обмеженням. Вимагати існування pdf також здається обмежувальним (зрештою, жоден дискретний розподіл не має pdf). Зауважте також, що SD є чітко визначеним - "значущим" - кожного разу, коли другий момент є кінцевим, і це включає атоми ймовірності (ваші функції "дельта Дірака").
whuber

Гаразд, я згоден, мабуть, був занадто обмежуючим, але загалом це те, що люди мають на увазі під СД. наприклад від Вольфрама: "Стандартне відхилення можна визначити для будь-якого розподілу з кінцевими першими двома моментами, але найчастіше вважати, що базовий розподіл є нормальним." Чи вважаєте ви, що якщо SD = 0 для однієї зі змінних, то базові припущення, що лежать в основі статистичної концепції кореляції, не виконуються?
tdc

Так, Томе, твоя остання заява на місці, і я з радістю приймаю. Однак ідея, яку вона висловлює, не дуже помітна у вашій відповіді; якщо він є, він похований у зауваженнях щодо звичайних розподілів, журналів, дельта-функцій та зосередженості на даних, а не на самих розподілах. До речі, слід бути обережними щодо статистичних тверджень, що з’являються на сайті Wolfram: він настільки сильно орієнтований на математику, що його характеристики щодо статистичної практики можуть бути сумнівними. Тут це неправильно: використання SD виходить за рамки параметрів нормального розподілу.
whuber

2

Кореляція - це косинус кута між двома векторами. Сказати, що стандартне відхилення для Y дорівнює нулю, це те саме, що говорити, що вектор Y-середнього (Y) дорівнює нулю (або, більш жорстко, що він являє собою нуль у відповідному векторному просторі). Тож виникає питання "Що можна сказати про (косинус) кута між нульовим вектором і вектором X-середнім (X)?". Більш загально, у будь-якому векторному просторі із внутрішнім твором, що розуміється під кутом між нульовим вектором та деяким іншим вектором? На цю думку, на мою думку, є лише одна відповідь, і це те, що поняття «кут» у цій ситуації є безглуздим, і тому поняття кореляції в цій ситуації безглуздо.


0

Відмова, я розумію, що вже є прийнята відповідь на якість, тому це має бути відповідь, але у мене немає досвіду, щоб це допустити. @Dilip зазначав, що ви можете визначити кореляцію як 0 для конвенції, але це здається проблематичним, оскільки воно мало б зовсім іншу інтерпретацію від кореляції, яка справді дорівнює нулю (з ненульовими SD). Оригінальне запитання говорить "якщо SD однієї змінної дорівнює нулю". Якщо ми просто зупинимось і подумаємо над визначенням змінної, тоді ми отримаємо набагато більш прямий шлях до відповіді. Змінна з 0 SD зовсім не є змінною, вона є постійною. Тож у такому випадку у вас немає двох змінних, тому концептуально взагалі не має сенсу визначати кореляцію.


Якщо у вас недостатньо балів для коментарів, не слід коментувати відповіді.
Майкл Р. Черник
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.