Інтервал довіри для chi-квадрата


10

Я намагаюсь знайти рішення, щоб порівняти два тести на користь чі-квадрат. Точніше, я хочу порівняти результати двох незалежних експериментів. У цих експериментах автори застосували чи-квадрат придатності для порівняння випадкових здогадок (очікуваних частот) із спостережуваними частотами. Два експерименти отримали однакову кількість учасників і експериментальні процедури ідентичні, змінилися лише подразники. У двох результатах експериментів було показано значне значення квадратика (наприклад, 1: X² (18) = 45; p <.0005 та пункт 2: X² (18) = 79; p <.0001).

Тепер я хочу перевірити, чи є різниця між цими двома результатами. Я думаю, що рішенням може бути використання довірчих інтервалів, але я не знаю, як обчислити ці довірчі інтервали лише за допомогою цих результатів. Або, можливо, тест для порівняння розміру ефекту (w Коена)?

У когось є рішення?

Дуже дякую!

FD


1
Привіт Флоріане. Чому б не використати тест на перестановку на різницю між квадратиками чи?
Тал Галілі

Привіт і дякую за вашу відповідь! Просто тому, що я насправді не знаю тестів на перестановки. Чи можна робити перестановку лише з двома значеннями chi-квадрата (у мене немає вихідних даних, лише результати)? Ще раз дякую :)
Флоріан

Відповіді:


8

Дуже обмежена у вас інформація, безумовно, є серйозним обмеженням! Однак речі не зовсім безнадійні.

Згідно з тими самими припущеннями, які призводять до асимптотичного розподілу для тестової статистики однойменного тесту на придатність, тестова статистика за альтернативною гіпотезою має асимптотично нецентральний розподіл χ 2 . Якщо припустити, що два подразника є а) значущими і b) мають однаковий ефект, відповідна статистика випробувань матиме однаковий асимптотичний нецентральний розподіл χ 2 . Ми можемо використовувати це , щоб побудувати тест - в основному, шляхом оцінки параметра Зміщення Л і , бачачи чи статистичні дані випробувань далеко в хвостах нецентральному х 2 ( 18 , λ )χ2χ2χ2λχ2(18,λ^)розповсюдження. (Це не означає, що цей тест матиме велику силу.)

Ми можемо оцінити параметр нецентральності за двома статистичними тестами, взявши їх середню величину і віднісши ступінь свободи (методи оцінки моментів), давши оцінку 44, або за максимальною ймовірністю:

x <- c(45, 79)
n <- 18

ll <- function(ncp, n, x) sum(dchisq(x, n, ncp, log=TRUE))
foo <- optimize(ll, c(30,60), n=n, x=x, maximum=TRUE)
> foo$maximum
[1] 43.67619

Гарна згода між нашими двома оцінками, насправді не дивно, якщо врахувати два пункти даних та 18 градусів свободи. Тепер обчислимо р-значення:

> pchisq(x, n, foo$maximum)
[1] 0.1190264 0.8798421

Отже наше p-значення 0,12, недостатнє для відкидання нульової гіпотези про те, що два подразника однакові.

λχ2(λ-δ,λ+δ)δ=1,2,,15δ і подивіться, як часто наш тест відмовляється на, скажімо, рівні 90% та 95% довіри.

nreject05 <- nreject10 <- rep(0,16)
delta <- 0:15
lambda <- foo$maximum
for (d in delta)
{
  for (i in 1:10000)
  {
    x <- rchisq(2, n, ncp=c(lambda+d,lambda-d))
    lhat <- optimize(ll, c(5,95), n=n, x=x, maximum=TRUE)$maximum
    pval <- pchisq(min(x), n, lhat)
    nreject05[d+1] <- nreject05[d+1] + (pval < 0.05)
    nreject10[d+1] <- nreject10[d+1] + (pval < 0.10)
  }
}
preject05 <- nreject05 / 10000
preject10 <- nreject10 / 10000

plot(preject05~delta, type='l', lty=1, lwd=2,
     ylim = c(0, 0.4),
     xlab = "1/2 difference between NCPs",
     ylab = "Simulated rejection rates",
     main = "")
lines(preject10~delta, type='l', lty=2, lwd=2)
legend("topleft",legend=c(expression(paste(alpha, " = 0.05")),
                          expression(paste(alpha, " = 0.10"))),
       lty=c(1,2), lwd=2)

що дає наступне:

введіть тут опис зображення

Дивлячись на справжні нульові точки гіпотези (значення осі x = 0), ми бачимо, що тест є консервативним, оскільки він, здається, не відкидає так часто, як вказував би рівень, але не переважно. Як ми і очікували, він не має великої потужності, але краще, ніж нічого. Цікаво, чи є кращі тести там, враховуючи дуже обмежену кількість наявної у вас інформації.


Я новачок у цьому матеріалі, я можу вас запитати, як запустити сценарій (якщо це був сценарій) з відповіді jbowman. У моєму випадку спробуйте отримати АБО від 90% ІС. Я дуже вдячний, якщо хтось із вас може мені це пояснити, і я використовую PASW17

Привіт зола6. Насправді це сценарій для програмного забезпечення R (для отримання додаткової інформації: r-project.org ), а не синтаксис для PASW17. Тож цей скрипт можна запустити безпосередньо в консолі R. Цей скрипт не обчислює довірчі інтервали, але дає вам значення p (тут точно> pchisq (x, n, foo $ max ==> [1] p-значення = 0.1190264), що відповідає тесту на різницю між двома експериментами (тут між двома стимулами, у випадку альтернативної гіпотези), і тут ми не можемо відкинути нульову гіпотезу про те, що два експерименти дали однакові результати.
Флоріан,

3

Ви можете отримати V Крамера, що інтерпретується як кореляція, перетворити його на Z Фішера, а потім довірчий інтервал цього прямого (SE = 1 / sqrt (n-3): Z ± se * 1,96). Після отримання кінці CI ви можете перетворити їх назад у r.

Чи обмірковували ви вносити всі свої рахунки в таблицю надзвичайних ситуацій з подальшим виміром експерименту?


Мені здалося, що не вдалося використати Phi з Пірсоном доброго пристосування чи-квадрата (1 змінна). Ось чому я говорив про w Коена, але формули справді подібні (phi = X² / n і w = sqrt (X² / n))! Але якщо ви можете обчислити phi за допомогою цього тесту і застосувати r до z перетворення, чи погоджуєтесь ви дати нам посилання на цитату? Ми хотіли б використати цей тест у статті, і декілька рецензентів можуть бути дуже виборчими зі статистикою. Це було б для нас такою чудовою допомогою! Щодо вашого запитання: у опублікованій статті ми не маємо вихідних даних лише для значення X², df та p. Дякую за допомогу!
Флоріан

Вибачте ... мав на увазі відкласти V Cramer's, а не phi. Cramer's V можна використовувати як фі.
Джон

І ні, у мене немає цитування. Якщо у вас великий ефект, не має значення, чи є невелика упередженість у цьому заході. Якщо у вас немає великого ефекту, переконайтеся, що ви не робите великих кісток з "значущості" будь-якого тесту.
Джон
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.