Як сума двох змінних може пояснити більше дисперсії, ніж окремі змінні?


13

Я отримую деякі непрості результати для співвідношення суми з третьою змінною, коли два предиктори негативно співвідносяться. Що викликає ці неспокійні результати?

Приклад 1: Кореляція між сумою двох змінних та третьої змінної

Розглянемо формулу 16.23 на сторінці 427 тексту Гільдфорда 1965 року, показану нижче.

Непроста знахідка: Якщо обидві змінні співвідносяться .2 з третьою змінною і співвідносяться -7 між собою, формула призводить до значення .52. Яким чином може бути співвідношення підсумкової з третьою змінною .52, якщо дві змінні корелюють лише .2 з третьою змінною?

Приклад 2: Яка множинна кореляція між двома змінними та третьою змінною?

Розглянемо формулу 16.1 на сторінці 404 тексту Гільдфорда 1965 року (показано нижче).

Заплутане знахідка: та ж ситуація. Якщо обидві змінні корелюють .2 з третьою змінною і співвідносяться -7 між собою, формула призводить до значення .52. Яким чином може бути співвідношення підсумкової з третьою змінною .52, якщо дві змінні корелюють лише .2 з третьою змінною?

Я спробував невелике моделювання Монте-Карло, і це підтверджує результати формул Гілфорда.

Але якщо два предиктори прогнозують 4% дисперсії третьої змінної, то як їх сума може передбачити 1/4 дисперсії?

співвідношення суми двох змінних з третьою змінною множинна кореляція двох змінних з третьою змінною

Джерело: Фундаментальна статистика з психології та освіти, 4-е видання, 1965.

ПОЯСНЕННЯ

Ситуація, з якою я маю справу, передбачає прогнозування майбутньої діяльності окремих людей на основі вимірювання їхніх здібностей зараз.

Дві діаграми Венна, наведені нижче, показують моє розуміння ситуації і призначені для уточнення моєї загадки.

Ця діаграма Венна (рис. 1) відображає нульовий порядок r = .2 між x1 і C. У моєму полі є багато таких змінних прогнозів, які скромно прогнозують критерій.

Рис.1

Ця діаграма Венна (рис. 2) відображає два таких предиктори, x1 та x2, кожен прогнозуючи C при r = .2, і два предиктори негативно корелюють, r = - 7.

Рис.2

Я втрачаю уявлення про зв'язок між двома прогнозами r = .2, які мали б їх разом передбачити 25% дисперсії C.

Я шукаю допомоги для розуміння взаємозв'язку між x1, x2 та C.

Якщо x2 (як це запропонували деякі у відповіді на моє запитання) x2 виконує функцію супресорної змінної для x1, яка область у другій діаграмі Венна придушується?

Якщо конкретний приклад був би корисним, ми можемо вважати, що x1 і x2 є двома людськими здібностями, а C - 4-річним середнім балом коледжу, через 4 роки.

У мене виникають труднощі з уявленням, як змінна супресора може призвести до збільшення 8% поясненої дисперсії двох r = .2 нульового порядку r's для збільшення та пояснення 25% дисперсії C. Конкретний приклад був би дуже корисною відповіддю.


У статистиці є давнє правило, згідно з яким дисперсія суми набору незалежних змінних дорівнює сумі їх дисперсій.
Майк Хантер

@DJohnson. Як ваш коментар стосується поставленого запитання?
Джоель В.

Вибачте, я не розумію питання. Для мене очевидно, як це стосується. Крім того, це коментар, який не підходить для винагороди і не вимагає більш глибокої розробки.
Мистер Хантер

1
@DJohnson. Як ваш коментар стосується поставленого запитання? Для мене НЕ очевидно, як це стосується.
Джоель В.

2
Ваше запитання про значення N поглядів може отримати кращу відповідь на сайті Meta CV.
mdewey

Відповіді:


3

Це може статися, коли обидва предиктори містять великий коефіцієнт неприємності, але з протилежним знаком, тому коли ви додаєте їх, неприємність скасовується, і ви отримуєте щось набагато ближче до третьої змінної.

Проілюструємо ще більш крайній приклад. Припустимо, є незалежними стандартними нормальними випадковими змінними. Тепер нехайX,YN(0,1)

A=X

B=X+0.00001Y

Скажіть, що - ваша третя змінна, A , B - ваші два предиктори, а X - латентна змінна, про яку ви нічого не знаєте. Кореляція A з Y дорівнює 0, а кореляція B з Y дуже мала, близька до 0,00001. * Але кореляція A + B з Y дорівнює 1.YA,BXA+BY

* Існує маленька крихітна корекція, коли стандартне відхилення B становить трохи більше 1.


Чи виникає такий тип ситуації в соціальних науках?
Джоель В.

1
У суспільствознавчому жаргоні це в основному лише сильний ефект, який бентежить слабкий ефект певним чином. Я не експерт з суспільних наук, але не можу уявити, що важко знайти приклад цього.
Павло

Чи можете ви мати якісь приклади, крім фізичних наук?
Джоель В.

Чи можна відносини, які ви описуєте, відображати на діаграмі Венна?
Джоель В.

Я особисто не знайшов би діаграму Венна корисною тут, але якщо потрібно, я намалював би B як прямокутник, а потім розділив його на два під прямокутники, великий жирний A і крихітний худий Y. Підсумовування A і B є скасовуючи велику частину A і залишаючи крихітну частину Y.
Павло

10

Ці три змінні можуть бути корисними як уявлення про лінійні комбінації інших некорельованих змінних. Щоб покращити наше розуміння, ми можемо зобразити їх геометрично, працювати з ними алгебраїчно та надавати статистичні описи, як нам заманеться.

Розглянемо, то, три корельовані з нульовим середнім, одиничною дисперсією змінних , Y , і Z . З них будують наступне:XYZ

U=X,V=(7X+51Y)/10;W=(3X+17Y+55Z)/75.

Геометричне пояснення

Наступна графіка - про все, що вам потрібно для розуміння взаємозв'язку між цими змінними.

Малюнок

UVWU+VX,Y,ZUVUVWUVW, зробивши гострий кут (близько 45 градусів): є несподівано висока позитивна кореляція.


Алгебраїчні розрахунки

Для тих, хто хоче більшої жорсткості, ось алгебра для резервного копіювання геометрії у графіці.

UVW

Cor(U,V)=Cov(U,V)=E(UV)=E(51XY7X2)/10=7/10=0.7

XY

Cor(U,W)=3/75=1/5=0.2

і

Cor(V,W)=(73+1517)/(1075)=1/5=0.2.

Нарешті,

Cor(U+V,W)=Cov(U+V,W)Var(U+V)Var(W)=1/5+1/5Var(U)+Var(V)+2Cov(U,V)=2/51+12(7/10)=2/53/50.5164.

Отже, ці три змінні мають бажані кореляції.


Статистичне пояснення

Тепер ми можемо зрозуміти, чому все працює так, як це відбувається:

  • UV7/10VUY

  • UW1/5WUYZ

  • VW1/5W75

    • 17YV
    • 3XV
    • Z
  • U+V=(3X+51Y)/10=3/100(3X+17Y)WWZ


Чи є спосіб показати це на діаграмі Венна? Незважаючи на математику, я все ще не бачу логіки суми двох змінних, що пояснюють 25 +% дисперсії третьої змінної, коли кожна з цих двох змінних, що входять до суми, прогнозує, але 4% дисперсії цієї третьої змінної . Як 8% поясненої дисперсії може стати 25% поясненою дисперсією лише додаванням двох змінних?
Джоель В.

Також, чи є практичне застосування цього дивного явища?
Джоель В.

Якщо діаграма Венна недоречна для відображення поясненої дисперсії, ви можете сказати мені, чому вона недоречна?
Джоель В.

@JoelW. Приємна відповідь стосується того, чому діаграми Венна не вирішують завдання ілюструвати це явище (наприкінці відповіді): stats.stackexchange.com/a/73876/5829
Джейк Вестфаль,

Джоель, Коенс використав венноподібну діаграму, яку вони назвали "Баллантин" для аналізу варіацій. Наприклад, див. Ww2.amstat.org/publications/jse/v10n1/kennedy.html . Що стосується практичних застосувань, вам слід задати протилежне запитання: які застосування дисперсійних та дисперсійних розкладів не є практичними?
whuber

5

Ще один простий приклад:

  • zN(0,1)
  • x1N(0,1)
  • x2=zx1z=x1+x2

Потім:

  • Corr(z,x1)=0
  • Corr(z,x2).7
  • Corr(z,x1+x2)=1

Геометрично те, що відбувається, схоже на графіці WHuber. Концептуально це може виглядати приблизно так: введіть тут опис зображення

E[XY]

x1zθ

  • Corr(z,x1)=cosθzx1=0θz,x1=π2
  • Corr(z,x2)=cosθzx2.7θz,x2=π4
  • Corr(z,x1+x2)=cosθz,x1+x2=1θz,x1+x2=0

zx1x2zx1x1x2x1x2


(+1) Гарний приклад!
користувач795305

Будь ласка, поясніть умови своєї відповіді. Поставивши z = x1 + x2, чому б сказати «тоді Corr (z, x1) = 0»? Ви хочете сказати, що Corr (z, x1) = 0 випливає з вашого першого заяви Let, або кореляція нуля є додатковим припущенням? Якщо це додаткове припущення, чому ситуація в первинному питанні вимагає цього додаткового припущення?
Джоель В.

zx1zx1zx1x2

@MatthewGunn. Ваш третій Нехай говорить z = x1 + x2. Це, здається, порушує ваші перші два. Скажімо, що z і x1 є незалежними.
Джоель В.

1
z=x1+x2zx1

3

Адресація вашого коментаря:

Незважаючи на математику, я все ще не бачу логіки суми двох змінних, що пояснюють 25 +% дисперсії третьої змінної, коли кожна з цих двох змінних, що входять до суми, прогнозує, але 4% дисперсії цієї третьої змінної . Як 8% поясненої дисперсії може стати 25% поясненою дисперсією лише додаванням двох змінних?

Тут схоже на те, що термінологія "пояснюється дисперсія". Як і багато термінів у статистиці, це було обрано для того, щоб це звучало так, що це означає більше, ніж насправді.

Y

y=(6,7,4,8,9,6,6,3,5,10)

UYRRY

r=(20,80,100,90,50,70,40,30,40,60)

U=R+0.1Y

u=(19.4,79.3,100.4,90.8,50.9,70.6,40.6,30.3,40.5,61.0)

V=R+0.1Y

v=(20.6,80.7,99.6,89.2,49.1,69.4,39.4,29.7,39.5,59.0)

UVYr0.2YY

YUURVRYU+V

Діаграма кожної зі змінних

ABBA


@ naught101 створив деякі фігури, щоб проілюструвати ваші змінні, Flounderer. Ви можете побачити, чи включає вони звернення до вас.
gung - Відновіть Моніку

Звичайно, відредагуйте його як завгодно. Я не можу насправді переглядати зображення на роботі, але я впевнений, що це буде добре!
Флонджер

Я відхилив пропозицію, не знаючи, що він тут зв’язався з вами. Ви можете затвердити його, перейшовши до запропонованої черги редагування.
gung - Відновіть Моніку

Наведений вами приклад цікавий, якщо ретельно продуманий, але ситуація, яку я представив, є більш загальною (з ретельно вибраними числами) та базується на двох змінних N (0,1). Навіть якщо ми змінимо термінологію з "пояснює" на "поділитися", питання залишається. Як можна 2 випадкові змінні, кожна з 4% спільної дисперсії з третьою змінною, поєднати у вигляді простої суми, яка за формулою має 25% спільної дисперсії з третьою змінною? Крім того, якщо мета - передбачення, чи є в реальному практичному застосуванні це дивне збільшення спільної дисперсії?
Joel W.

Що ж, в будь-якій точці електроніки, коли у вас є (гучний шум + слабкий сигнал) + (-гучний шум) = слабкий сигнал, ви б застосували це. Наприклад, навушники з шумопоглинанням.
Флонджер
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.