Так, це все одно буде помилкою.
Ось дуже проста фігура, що показує чотири різні ситуації. У кожному випадку червоні точки являють собою жінки, сині крапки - чоловіки, горизонтальна вісь - розмір мозку, а вертикальна - IQ. Я створив усі чотири набори даних таким чином:
завжди існує однакова різниця в середньому розмірі мозку між чоловіками ( ) і жінками ( 28 - одиниці довільні). Це засоби популяції, але ця різниця є достатньо великою, щоб стати статистично значимою при будь-якому розумному розмірі вибірки;2228
завжди існує нульова різниця середнього IQ між чоловіками та жінками (обидва ), а також нульова кореляція між статтю та IQ;100
сила кореляції між розмірами мозку та IQ змінюється, як показано на малюнку.
У лівій верхній частині субплоти між гендерною кореляцією (обчислюється окремо над чоловіками та окремо над жінками, потім усереднюється) - , як у вашій цитаті. У верхньому правому підгрупі загальна кореляція (для чоловіків та жінок разом) становить 0,3 . Зауважте, що у вашій цитаті не вказано, на що посилається число 0,33 . У нижній лівій субплоті кореляція між статтю становить 0,9 , як у вашому гіпотетичному прикладі; у нижній правій підводці загальна кореляція становить 0,9 .0.30.30.330.90.9
Таким чином, ви можете мати будь-яке значення кореляції, і не має значення, чи обчислюється воно загальним чи всередині групи. Яким би не був коефіцієнт кореляції, цілком можливо, що між статтю та коефіцієнтом інтелекту є нульова кореляція та нульова різниця статі в середньому значення IQ.
Вивчення неперехідності
Давайте дослідимо повний простір можливостей, дотримуючись підходу, запропонованого @kjetil. Припустимо, у вас є три змінні і (без втрати загальності) припустимо, що кореляція між x 1 і x 2 є a > 0, а кореляція між x 2 і x 3 є b > 0 . Питання: яке мінімально можливе позитивне значення кореляції λ між x 1 і x 3x1,x2,x3x1x2a>0x2x3b>0λx1x3? Чи іноді це має бути позитивним, або він завжди може бути нульовим?
Кореляційна матриця є і вона повинна мати невід'ємний детермінант, тобто d e t R = - λ 2 + 2 a b λ - ( a 2 + b 2 - 1 ) ≥ 0 , що означаєщо Л повинна лежать між в Ь ± √
R=⎛⎝⎜1aλa1bλb1⎞⎠⎟
detR=−λ2+2abλ−(a2+b2−1)≥0,
λЯкщо обидва корені позитивні, то мінімальне можливе значення
λдорівнює меншому кореню (і
λмає бути додатним!). Якщо нуль знаходиться між цими двома коренями, то
λможе бути нульовим.
a b ± ( 1 - a2) ( 1 - б2)-------------√.
λλλ
Ми можемо вирішити це чисельно і побудувати мінімально можливе додатне значення для різних a і b :λаб
Неофіційно можна сказати, що кореляції будуть транзитивними, якщо врахувати, що і b > 0 , можна зробити висновок, що λ > 0 . Ми бачимо , що для більшості значень через та Ь , λ може дорівнювати нулю, що означає , що кореляції неперехідний. Однак для деяких досить високих значень a і b кореляція λ повинна бути позитивною , тобто все-таки є "деякий ступінь перехідності", але обмежується лише дуже високою кореляцією. Зауважимо, що обидві кореляції a і ba > 0b>0λ>0abλabλ ab повинні бути високими.
Ми можемо розробити точну умову цієї "транзитивності": як було сказано вище, менший корінь повинен бути позитивним, тобто , що еквівалентнов2+б2>1. Це рівняння кола! І справді, якщо подивитися на фігуру вище, ви помітите, що синя область утворює чверть кола.ab−(1−a2)(1−b2)−−−−−−−−−−−−−√>0a2+b2>1
У вашому конкретному прикладі, кореляція між підлогою і розміром мозку вельми помірним (можливо = 0,5 ) і кореляція між розміром мозку і IQ є б = 0,33 , який міцно в синій області ( 2 + Ь 2 < 1 ) означає , що λ може бути додатним, негативним або нульовим.a=0.5b=0.33a2+b2<1λ
Відповідна цифра з оригінального дослідження
Ви хотіли уникати обговорення статі та мізків, але я не можу не зазначити, що, дивлячись на повну цифру з оригінальної статті ( Gur et al. 1999 ), можна побачити, що в той же час, як у вербальній оцінці IQ немає різниці статей, існує очевидна і суттєва різниця в просторовій шкалі IQ! Порівняйте субплоти D і F.