Коли z-перетворення Фішера підходить?


13

Я хочу перевірити вибіркову кореляцію на значущість, використовуючи p-значення, тобтоr

H0:ρ=0,H1:ρ0.

Я зрозумів, що можу використовувати z-перетворення Фішера, щоб обчислити це

zobs=n32ln(1+r1r)

і знаходження p-значення за

p=2P(Z>zobs)

використовуючи стандартний нормальний розподіл.

Моє запитання: наскільки великим має бути щоб це було відповідним перетворенням? Очевидно, що повинно бути більше 3. У моєму підручнику немає жодних обмежень, але на слайді 29 цієї презентації написано, що має бути більше 10. Для даних, які я буду розглядати, у мене буде щось на зразок .nnn5 n 10n5n10


2
Сторінка Вікіпедії перераховує стандартну помилку яка задається де - розмір вибірки. Тож вам знадобиться принаймні 4 цілі пари. Мені невідомі будь-які обмеження, ніж обмеження щодо розміру вибірки. 1 / zobs N1/N3N
COOLSerdash

8
Не впевнений, наскільки довіряти презентації тому, хто не може написати власне ім’я університету. Більш серйозно, остерігайтеся будь-яких порад, з яких випливає, що все в порядку вище певного розміру зразка і інакше спрямоване. Це питання якості наближення, що плавно збільшується з розміром вибірки, а також залежно від розподілу даних. Проста порада - бути дуже обережним, планувати все та перехресно перевіряти з завантаженими інтервалами довіри.
Нік Кокс

1
На слайді 17 описується тест t для особливого випадку . ρ=0
whuber

Відповіді:


8

У таких питаннях я б просто запустив моделювання і побачив, чи поводяться -значення так, як я їх очікую. Значення значення - це ймовірність випадкового складання зразка, що відхиляється принаймні стільки ж від нульової гіпотези, скільки даних, які ви спостерігали, якщо нульова гіпотеза є істинною. Отже, якби у нас було багато таких зразків, і в одному з них було -значення .04, тоді ми очікували б, що 4% цих зразків матиме значення менше 0,04. Те саме стосується всіх інших можливих значень.p p ppppp

Нижче є моделювання в Stata. Графіки перевіряють, чи вимірює -значення те, що вони повинні вимірювати, тобто вони показують, на скільки частка відборів з -значеннями меншою за номінальну -значення відхиляється від номінальної -значення. Як видно, тест є дещо проблематичним при такій малій кількості спостережень. Незалежно від того, чи це занадто проблематично для вашого дослідження, це ваш засуд.p p ppppp

clear all
set more off

program define sim, rclass
    tempname z se
    foreach i of numlist 5/10 20(10)50 {
        drop _all
        set obs `i'
        gen x = rnormal()
        gen y = rnormal()
        corr x y 
        scalar `z'  = atanh(r(rho))
        scalar `se' = 1/sqrt(r(N)-3)
        return scalar p`i' = 2*normal(-abs(`z'/`se'))
    }
end

simulate p5 =r(p5)  p6 =r(p6)  p7  =r(p7)     ///
         p8 =r(p8)  p9 =r(p9)  p10 =r(p10)    ///
         p20=r(p20) p30=r(p30) p40 =r(p40)    ///
         p50=r(p50), reps(200000) nodots: sim 

simpplot p5 p6 p7 p8 p9 p10, name(small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

введіть тут опис зображення

simpplot p20 p30 p40 p50 , name(less_small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

введіть тут опис зображення


1
Спробуйте відняти 2,5 замість 3 від :-). n
whuber

5

FWIW Я бачу рекомендацію у Myers & Well (дослідження дизайну та статистичний аналіз, друге видання, 2003, стор. 492). У виносці зазначено:N10

Строго кажучи, перетворення зміщене величиною : див. Пірсон і Хартлі (1954, стор. 29). Це зміщення, як правило, є незначним, якщо невеликий і великий, і ми тут його ігноруємо.Zr/(2(N1))Nρ


3
Здається, це відповідь для мене.
gung - Відновити Моніку

1

Не впевнений , є чи Фішера перетворення доречно тут. Для (Примітка: нульова гіпотеза призначена для сукупності , а не вибірки ), розподіл вибірки коефіцієнта кореляції вже симетричний, тому не потрібно зменшувати косості, що має на меті зробити Fisher , і ви можете використовувати наближення Стьюдента .zH0:ρ=0ρrzt

Якщо припустити, що ви маєте на увазі , то косостість цього PDF буде залежати від запропонованого значення , тож загальної відповіді про те, яким має бути великий не буде. Також мінімальні значення залежать від рівня значущості яким ви працюєте. Ви не вказали його значення.H0:ρ=ρ00ρ0nnα

Справа Ніка справедлива: наближення та рекомендації завжди діють у якійсь сірій зоні.

Якщо тоді ваше наближення Фішера добре (= симетричне), я б використав зв'язаний застосовується до -розподілів, де - стандарт вибірки відхилення. Якщо вона досить близька до нормальності, це стає .n(tα/2s/ϵ)2tsn(1.96s/ϵ)2


4
Я думаю, що це надто полегшує "мету" Фішера , що частково є питанням мети, а також математики. Хиткість чи ні - лише частина картини; перетворює обмежений розподіл у необмежений, що важливо для довірчих інтервалів. Насправді я б заперечував, що якщо нулева гіпотеза нульової кореляції також не є науковим питанням, використання Фішера довірчих інтервалів є набагато пліднішим, ніж намагання отримати P-значення. zzz
Нік Кокс

1
Я шкодую, я новачок в Фішера -перетворення. Чи повинен я використовувати його, лише якщо хочу перевірити ? Причиною для обчислення P-значень є те, що я хочу використовувати метод Холма-Бонферроні для контролю рівня помилок у сімейному режимі, коли роблю багаторазове порівняння. Чи варто швидше обчислити значення P з розподілу Стьюдента ? H 0 : ρ = ρ 00 tzH0:ρ=ρ00t
Gunnhild

3
Питання неправильне, я думаю. Fisher є кращим методом для довірчих інтервалів і для висновку взагалі. Я думаю, більшість програмного забезпечення використовує розрахунок на основі для тестування . Якщо ви сумніваєтесь, це може бути дуже важливо показати, чи впливає один метод на ваші дані. Тож, якщо методи згодні, проблем немає. t ρ = 0ztρ=0
Нік Кокс

1
z

ϵn
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.