Чи можна р-значення для тесту кореляції Пірсона обчислювати саме з коефіцієнта кореляції та розміру вибірки?


12

Передумови: я прочитав одну статтю, де автори повідомляють про співвідношення Пірсона 0,754 від розміру вибірки 878. Результат p-значення для тесту кореляції є значущим "дві зірки" (тобто p <0,01). Однак я вважаю, що при такому великому розмірі вибірки відповідне значення p повинно бути менше 0,001 (тобто три зірки).

  • Чи можна р-значення для цього тесту обчислювати саме з коефіцієнта кореляції Пірсона та розміру вибірки?
  • Якщо так, то як це можна зробити в R?

Відповіді:


14

Так, це можна зробити, якщо використовувати перетворення Risher-z на Fisher. Інші методи (наприклад, завантажувальна програма) можуть мати певні переваги, але вимагають оригінальних даних. У R ( r - коефіцієнт кореляції вибірки, n - кількість спостережень):

z <- 0.5 * log((1+r)/(1-r))
zse <- 1/sqrt(n-3)
min(pnorm(z, sd=zse), pnorm(z, lower.tail=F, sd=zse))*2

Дивіться також цю публікацію в моєму блозі .

Це сказало, що це .01 або .001 не має великого значення. Як ви вже говорили, це здебільшого функція розміру вибірки, і ви вже знаєте, що розмір вибірки великий. Логічний висновок полягає в тому, що вам, мабуть, взагалі не потрібен тест (особливо це не тест так званої гіпотези «нуль», що кореляція дорівнює 0). Маючи N = 878, ви можете бути впевнені в точності оцінки і зосередитись на її інтерпретації безпосередньо (тобто, у вашому полі велика кількість .75).

Однак формально, коли ви робите статистичний тест у рамках Неймана-Пірсона, вам потрібно заздалегідь вказати рівень помилок. Отже, якщо результати тесту дійсно мають значення і дослідження було заплановано як .01 як поріг, то має сенс лише повідомити p <.01, і вам не слід умовно-регламентувати його p <.001 на основі отриманого p значення. Цей тип нерозкритої гнучкості є навіть однією з головних причин критики маленьких зірок, а загалом - способу тестування значущості гіпотез у соціальній науці.

Див. Також Meehl, PE (1978). Теоретичні ризики та табличні зірочки: сер Карл, сер Рональд та повільний прогрес м'якої психології. Журнал консалтингової та клінічної психології, 46 (4), 806-834. (У заголовку міститься посилання на цих «зірок», але зміст - це набагато ширше обговорення ролі тестування значимості.)


1
Я, мабуть, порадив би їм відмовитися від маленьких зірок, навіть якщо результати правильні, але я бачу вашу думку.
Гала

1
Я відредагував свою відповідь, щоб додати зауваження щодо цієї проблеми. Зауважимо, що 0,001 <0,01, тому автори формально "правильні" у будь-якому випадку, це більше питання про те, яким чином мають на увазі результати звіту. Я думаю, що на відміну від відвертої помилки, яку, звичайно, повинен виправити рецензент, це питання слід залишити авторам для вирішення.
Гала

1
Ви маєте рацію, але поки що я ніколи не бачив повідомлення про p <0,01, якщо p насправді менше 0,001 (не кажучи про те, що рівень довіри для статті становить 0,01). Більше того, у статті, про яку я говорю, автори повідомляють про 30 кореляційних тестах на основі розмірів вибірки від 837 до 886 із співвідношеннями в межах від 0,145 до 0,754, і всі вони повідомляються як дві зірки.
Мирослав Сабо

1
У мене є проблема розмістити свій код тут, але я запускаю симуляції, і p-значення з вашого коду не те саме, що p-значення від cor.test.
Мирослав Сабо

4
Я написав підручник з огляду використання Фішера z для кореляцій, доступних на сайті stata-journal.com/sjpdf.html?articlenum=pr0041 Я рекомендував би більше використовувати інтервали довіри та обчислити 0,724, 0,781 як 95% межі. Я рекомендую ще більше переглянути дані та опрацювати регресію.
Нік Кокс

2

ви використовуєте перетворення Risher-z на Фішера.

Є альтернативна статистика:

abs(r)*sqrt((n-2)/(1-r^2)) ~ t.dist(d.f.=n-2)

що має t-розподіл з n-2 ступенями свободи. Наприклад, як це працює, наприклад: http://www.danielsoper.com/statcalc3/calc.aspx?id=44

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.