Порівняння коефіцієнтів кореляції


11

У мене є два набори даних, де у мене є ~ 250 000 значень для 78 та 35 зразків. Деякі зразки є членами сім'ї, і це може вплинути на дані. Я розраховував попарну кореляцію, і вона коливається між 0,7 і 0,95, але я хотів би знати, чи є значна різниця в коефіцієнтах кореляції внутрішньо та між сімейними? Який найкращий спосіб зробити це? Дякую

Відповіді:


6

Загальний спосіб порівняння двох коефіцієнтів кореляції р 1 , ρ 2 є використання Z-перетворення метод Фішера, який говорить , що г deg ; С т а н ч ( р ) наближено нормально з середнім значенням в г deg ; С т а н ч ( ρ ) та стандартне відхилення 1 / ρ^1,ρ^2аrcтангод(ρ^)аrcтангод(ρ) . Якщо вибірки незалежні, ви перетворите кожен коефіцієнт кореляції, і різниця між двома перетвореними кореляціями буде нормальною із середнімarctanh(ρ 1 )-arctanh(ρ 2 )та стандартним відхилення1/н-3аrcтангод(ρ1)-аrcтангод(ρ2) . З цього ви можете сформуватиz-statistic і зробити тестування, як у звичайномудвопробномуz-test.1/(н1-3)+1/(н2-3)zz


2

Хоча відповідь @ Макроса хороша, вона вимагає припущення про (не) залежність статистики. Іншим підходом було б використання завантажувальної програми. Ідея полягала б у тому, щоб утримати одну змінну фіксованою та перетасувати іншу змінну, обчислити співвідношення для кожного вашого зразка та взяти їх різницю. Повторіть багато разів, щоб отримати розподіл, і використовуйте цей розподіл для перевірки гіпотези, що кореляції однакові. Структура вашого набору даних мені не зовсім зрозуміла, тому важко надати більше деталей.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.