Неперехідність кореляції: кореляція між статтю та розміром мозку та розміром мозку та IQ, але немає кореляції між статтю та IQ


18

У блозі я знайшов таке пояснення, і хотів би отримати більше інформації про неперехідність кореляції:

У нас є такі незаперечні факти:

  • В середньому різниця в обсязі мозку між чоловіками і жінками
  • Існує кореляція між IQ та розміром мозку; кореляція становить 0,33 і, таким чином, відповідає 10% варіабельності IQ

З цих приміщень 1 і 2, схоже, логічно випливає з цього: жінки в середньому мають нижчий IQ, ніж чоловіки. Але це помилка! У статистиці кореляції не є перехідними. Доказом є те, що потрібно просто подивитися на результати тестів на IQ, і вони показують, що IQ чоловіків і жінок в середньому не відрізняється.

Я хотів би зрозуміти цю неперехідність кореляції трохи глибше.

Якби співвідношення IQ і розміру мозку становило 0,9 (що я знаю, це не (1)), випливало б, що у жінок в середньому нижчий IQ, ніж у чоловіків, все-таки було б помилкою?

Будь ласка, я не тут, щоб говорити про IQ (і межі тесту), сексизм, жіночий стереотип, зарозумілість тощо (2). Я просто хочу зрозуміти логічні міркування про помилковість.


(1) що я знаю, що це не так: неандертальці мали більший мозок, ніж homo sapiens, але не були розумнішими;

(2) Я жінка і загалом, я не вважаю себе або інших жінок менш розумними, ніж чоловіки, мені не байдуже тест на IQ, тому що те, що рахується - це цінність людей, і це не базується на інтелектуальні здібності.


Оригінальне джерело французькою мовою:

Зрештою, незаперечні заявники:

  • il ya une différence de volume cérébral en moyenne entre hommes et femmes
  • il ya une corrélation entre QI et volume cérébral; la corrélation est 0,33 і відповідають donc à 10% de la variabilité

De ces prémisses 1 et 2, il semble découler logiquement que: les femmes ont en moyenne un QI inférieur aux hommes.

Mais c'est une erreur de raisonnement! Статистичні дані, менше коригувань щодо транзитивних переходів. Попередньо, ви можете залишити чистий чистий чистий, достатній показник тестів на тестування QI, і це може бути QI des hommes et des femmes ne diffèrent pas en moyenne.

введіть тут опис зображення


5
Я не розумію, як ці твердження взагалі мають відношення до кореляції (а посилання на "транзитивність" видається цілком недоречним у цьому контексті). Зрештою, висновок пов'язаний із середньою різницею. Ця статистика (що є першим моментом) взагалі не залежить від кореляції (яка походить від другого моменту). Навіть коли кореляція є досконалою не можна робити жодних висновків про різницю засобів другої змінної на основі різниці середніх значень першої змінної. ±1
whuber

5
Можна показати (Ленгфорд, Швертман та Оуенс (2001)), що позитивна кореляція є перехідною, якщо сума квадратичних кореляцій більша за 1: ρXY2+ρYX2>1ρXZ>0
CloseToC

2
@whuber: Так, але це питання не про співвідношення засобів X і Y (розмір мозку та IQ), це питання про взаємозв'язок між засобами Y у двох різних кластерах ... Я думаю, що це очевидно що якщо кореляція між розміром мозку та IQ є ідеальною (тобто IQ є лінійною функцією розміру мозку) і якщо середній розмір мозку відрізняється між чоловіками та жінками, то середній показник IQ відрізняється між чоловіками та жінками.
Амеба каже, що поверніть Моніку

2
@Amoeba Дякую за тлумачення Цитата починає мати сенс (нарешті!). Але називати це "транзитивністю кореляції" є настільки неясним, що відверто вводити в оману. (Фраза є в оригінальній французькій мові, тому ми навіть не можемо звинувачувати переклад.)
whuber

3
@amoeba Це правдоподібно. Але я думаю, що вам доведеться досить розтягнути речі, щоб прибути туди! Цитата не характеризує співвідношення між статтю та розміром мозку як "кореляцію" - лише як різницю в засобах між двома групами (що , до речі, не є стандартною мірою кореляції). Але я думаю, що ми маємо розуміти "кореляцію" в широкому розумінні як "відсутність залежності" чи щось подібне.
whuber

Відповіді:


16

Так, це все одно буде помилкою.

Ось дуже проста фігура, що показує чотири різні ситуації. У кожному випадку червоні точки являють собою жінки, сині крапки - чоловіки, горизонтальна вісь - розмір мозку, а вертикальна - IQ. Я створив усі чотири набори даних таким чином:

  • завжди існує однакова різниця в середньому розмірі мозку між чоловіками ( ) і жінками ( 28 - одиниці довільні). Це засоби популяції, але ця різниця є достатньо великою, щоб стати статистично значимою при будь-якому розумному розмірі вибірки;2228

  • завжди існує нульова різниця середнього IQ між чоловіками та жінками (обидва ), а також нульова кореляція між статтю та IQ;100

  • сила кореляції між розмірами мозку та IQ змінюється, як показано на малюнку.

кореляції

У лівій верхній частині субплоти між гендерною кореляцією (обчислюється окремо над чоловіками та окремо над жінками, потім усереднюється) - , як у вашій цитаті. У верхньому правому підгрупі загальна кореляція (для чоловіків та жінок разом) становить 0,3 . Зауважте, що у вашій цитаті не вказано, на що посилається число 0,33 . У нижній лівій субплоті кореляція між статтю становить 0,9 , як у вашому гіпотетичному прикладі; у нижній правій підводці загальна кореляція становить 0,9 .0,30,30,330,90,9

Таким чином, ви можете мати будь-яке значення кореляції, і не має значення, чи обчислюється воно загальним чи всередині групи. Яким би не був коефіцієнт кореляції, цілком можливо, що між статтю та коефіцієнтом інтелекту є нульова кореляція та нульова різниця статі в середньому значення IQ.


Вивчення неперехідності

Давайте дослідимо повний простір можливостей, дотримуючись підходу, запропонованого @kjetil. Припустимо, у вас є три змінні і (без втрати загальності) припустимо, що кореляція між x 1 і x 2 є a > 0, а кореляція між x 2 і x 3 є b > 0 . Питання: яке мінімально можливе позитивне значення кореляції λ між x 1 і x 3х1,х2,х3х1х2а>0х2х3б>0λх1х3? Чи іноді це має бути позитивним, або він завжди може бути нульовим?

Кореляційна матриця є і вона повинна мати невід'ємний детермінант, тобто d e t R = - λ 2 + 2 a b λ - ( a 2 + b 2 - 1 ) 0 , що означаєщо Л повинна лежать між в Ь ±

R=(1аλа1бλб1)
гетR=-λ2+2абλ-(а2+б2-1)0,
λЯкщо обидва корені позитивні, то мінімальне можливе значенняλдорівнює меншому кореню (іλмає бути додатним!). Якщо нуль знаходиться між цими двома коренями, тоλможе бути нульовим.
аб±(1-а2)(1-б2).
λλλ

Ми можемо вирішити це чисельно і побудувати мінімально можливе додатне значення для різних a і b :λаб

Дослідження неперехідності

Неофіційно можна сказати, що кореляції будуть транзитивними, якщо врахувати, що і b > 0 , можна зробити висновок, що λ > 0 . Ми бачимо , що для більшості значень через та Ь , λ може дорівнювати нулю, що означає , що кореляції неперехідний. Однак для деяких досить високих значень a і b кореляція λ повинна бути позитивною , тобто все-таки є "деякий ступінь перехідності", але обмежується лише дуже високою кореляцією. Зауважимо, що обидві кореляції a і bа>0b>0λ>0abλabλ ab повинні бути високими.

Ми можемо розробити точну умову цієї "транзитивності": як було сказано вище, менший корінь повинен бути позитивним, тобто , що еквівалентнов2+б2>1. Це рівняння кола! І справді, якщо подивитися на фігуру вище, ви помітите, що синя область утворює чверть кола.ab(1a2)(1b2)>0a2+b2>1

У вашому конкретному прикладі, кореляція між підлогою і розміром мозку вельми помірним (можливо = 0,5 ) і кореляція між розміром мозку і IQ є б = 0,33 , який міцно в синій області ( 2 + Ь 2 < 1 ) означає , що λ може бути додатним, негативним або нульовим.a=0.5b=0.33a2+b2<1λ


Відповідна цифра з оригінального дослідження

Ви хотіли уникати обговорення статі та мізків, але я не можу не зазначити, що, дивлячись на повну цифру з оригінальної статті ( Gur et al. 1999 ), можна побачити, що в той же час, як у вербальній оцінці IQ немає різниці статей, існує очевидна і суттєва різниця в просторовій шкалі IQ! Порівняйте субплоти D і F.

Гур та ін.


2
Я люблю ті генеровані вами сюжети. Ті, що з паперу, не так багато ...
shadowtalker

1
@AleksandrBlekh: Правду кажучи, я не впевнений. "Теплова карта"? "Контурний сюжет", але кольоровий і без контурів?
амеба каже, що поверніть Моніку

2
|λ|λ

1
xyyzxzab0λ0

1
Дякую амебі за цю довгу і детальну відповідь (та ще й додав таку додаткову, дуже до вподоби)! Це робить речі критичними! Ця концепція настільки складна для мого статистично непідготовленого мозку, і ви затінили світло на проблему! Велике спасибі за час, який ви витратили на публікацію своєї відповіді!
MagTun

8

x1=IQ,x2=genderx3

cor(x1,x2)=λ,cor(x1,x3)=cor(x2,x3)=ρ=0.9
λ
R=(1λρλ1ρρρ1)
ρ
detR=1(1ρ2)λ(λρ2)+ρ(λρρ)=1λ22ρ2+2λρ20,
ρ2λ+12ρ=0.9λ0.62

Оновлення:

p=0.5μ1=E(x1|x2=1)μ0=E(x1|x2=0)μ=E(x1)μ=0=μ1+μ0μ0=μ1x1N(μ=0,σ2)x2p=1/2

corr(x1,x2)=E(x1μ)E(x2p)σ12=Δ2σ
Δ=μ1μ0=2μ1σ=10Δ/20інформація про середню різницю IQ помилкова! Це було б правдою, якби стать була суцільною змінною, яка, очевидно, не є. Зауважимо, що цей факт пов'язаний з тим, що для біноміального розподілу дисперсія є функцією середнього (як це має бути, оскільки для зміни варіюється лише один вільний параметр). Те, що ми зробили вище, насправді поширює це на коваріацію / кореляцію.

ρ=0.33λ0.7822λ=0


1
cor(x1,x2)0.62E(x1)E(x2)

5
+1 - Але я вважаю, що концепція співвідношення IQ серед чоловіків і жінок є дещо заплутаною, оскільки ви ніколи не могли обчислити таке значення.
Енді Ш

1
Що має означати взаємозв'язок між чоловічим та жіночим IQ ?!
Амеба каже, що поверніть Моніку

так, це правильно @amoeba! Я, можливо, не використав правильні слова, щоб висловити свою плутанину (це важко, тому що я не звик до статистики), але змінна - це справді стать, IQ та розмір мозку.
MagTun

7

Це ситуація, в якій мені подобається використовувати діаграми контурів, щоб проілюструвати прямі ефекти та непрямі ефекти, і як ці два впливають на загальну кореляцію.

Згідно з оригінальним описом маємо кореляційну матрицю нижче. Розмір головного мозку становить близько 0,3 кореляції з IQ, жінки та IQ мають 0 кореляцію між собою. Я заповнюю негативну кореляцію між розмірами жінки та мозку до -0,3 (якщо я повинен був здогадатися, він набагато менший за це, але це буде служити для ілюстрації).

       Brain  Female  IQ
 Brain   1
Female  -0.3    1
    IQ   0.3    0      1

Якщо ми підходимо до регресійної моделі, де IQ є функцією розміру мозку і бути жінкою, ми можемо проілюструвати це на основі діаграми шляху. Я заповнив коефіцієнти часткової регресії на стрілках, а B вузол означає розмір мозку, а F вузол - жіночий.

введіть тут опис зображення

Тепер як це божевільно - контролюючи розмір мозку, враховуючи ці кореляції, жінки мають позитивний зв’язок з IQ. Чому це так, коли гранична кореляція дорівнює нулю? За правилами з лінійними діаграмами шляху ( Wright, 1934 ) ми можемо розкласти граничну кореляцію як функцію прямого ефекту при контролі розміру мозку та непрямого ефекту:

TotalF,IQ=DirectF,IQ+IndirectF,B,IQ

TotalF,IQ=Кор(Ж,IQ)

IndirectF,B,IQ=Cor(F,B)Cor(B,IQ|F)0.099=0.30,33

Оскільки загальний ефект дорівнює нулю, ми знаємо, що прямий ефект повинен бути просто протилежним знаком і розміром непрямого ефекту , отже, в цьому прикладі прямий ефект дорівнює 0,09. Тепер ми маємо ситуацію, коли оцінюючи очікуваний IQ жінок, ми отримуємо дві різні відповіді, хоча, ймовірно, не те, що ви спочатку очікували, уточнюючи питання. При простому оцінці граничного очікуваного показника IQ у жінок проти чоловіків різниця дорівнює нулю, як ви його визначили (маючи нульову кореляцію). Оцінюючи очікувану різницю, обумовлену розміром мозку, жінки мають більшу IQ, ніж чоловіки.

Ви можете вставити в цей приклад або більші кореляції між розміром мозку та коефіцієнтом інтелекту (або меншими співвідношеннями між розмірами жінки та мозку), з огляду на межі, які показує його відповідь. Збільшення першого збільшує розбіжність між умовними коефіцієнтами інтелекту жінок та чоловіків ще більшими на користь жінок, зменшення останнього робить різниці меншими.


Якщо ви подивитеся на подану картину, вона показує позитивну (і сильнішу за чоловічу) кореляцію обсягу мозку жінок з IQ.
Алекос Пападопулос

1
@Andy W Мені соромно задавати це нерозумне запитання, але яке програмне забезпечення ви використали, щоб намалювати графік вузлів?
mugen

1
Це була швидка робота в inkscape @mugen. Займаючи більше часу, я думаю, що ті, які я роблю за допомогою латексу та Tikz , приємніші.
Енді Ш

+1 Не могли б ви вказати на теорію, що стоїть за вашою другою формулою?
Олександр Блех

2
@AleksandrBlekh - документ Райт, який я цитую, - це джерельне джерело. Джудея Перл заглиблюється в більш обширний коментар у своїй книзі про причинність , хоча є і більш прості методи лікування. (Для лінійних моделей декомпозиції часто надаються побіжною обробкою в книгах з моделювання структурних рівнянь.)
Енді Ш

3

vq12

(1)Е(v1)>Е(v2)=βЕ(v1),0<β<1,ρ(v1,q1)>0,ρ(v2,q2)>0

Зауважимо, що, хоча в цитованому тексті йдеться про "співвідношення між обсягом мозку та IQ" загалом, надане зображення робить розмежування з двома лініями тренду (тобто воно показує кореляцію для двох підгруп окремо). Тож ми розглянемо їх окремо (це правильний шлях).

Потім

ρ(v1,q1)>0Соv(v1,q1)>0Е(v1q1)>Е(v1)Е(q1)

(2)Е(v1q1)Е(q1)>Е(v1)

і

ρ(v2,q2)>0Соv(v2,q2)>0Е(v2q2)>Е(v2)Е(q2)

(3)Е(v2q2)βЕ(q2)>Е(v1)

Е(q1)>Е(q2)

(4)Е(q1)=Е(q2)=q¯

Тоді має бути так

(5)(2),(4)Е(v1q1)q¯>Е(v1)

і це

(6)(3),(4)Е(v2q2)βq¯>Е(v1)

(5)(6)
(1)

(1)E(q1)E(q2)(1)


2
Незважаючи на всі наведені тут розрахунки, я все ще не бачу, як кореляція виявляє взагалі що-небудь (або накладає будь-які обмеження) щодо відносин між середніми значеннями.
whuber

@whuber Вся відповідь полягає в тому, щоб показати, що це не так. Останні речення говорять саме про це. Додамо ще один ефект до цього ефекту.
Алекос Пападопулос

Але це абсолютно просто: для показу не потрібна ціла сторінка рівнянь! Досить зауважити, що коефіцієнти кореляції є інваріантними за місцем розташування, QED . Я неправильно трактую питання?
whuber

1
@whuber При всій належній повазі та жодних образах нікому не призначених, але я боюся, що ви "неправильно інтерпретуєте" рівень знань з ОП. Інакше питання не було б розміщене.
Алекос Пападопулос

4
Тоді я б закликав вас задуматися над тим, чи є і як будь-яка відповідь, що сильно покладається на математичні рівняння, підходить для звернення до плакатів, які, як видається, вимагають елементарних викладів основних понять. Це тонке питання, бо іноді це саме правильний підхід. Крім того, ступінь використання математики - і як викладає математичні ідеї - може бути справою смаку. Але ІМХО така відповідь є ефективною лише тоді, коли математика чітка і послідовно зосереджена на важливій ідеї.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.