D Коена для t-тесту залежного зразка


10

Швидке запитання: Я бачив, як Коен розраховував два різні способи для тестування залежних зразків (наприклад, в рамках зразків, що перевіряють ефективність ліків із термінами до / після).

  1. Використовуючи стандартне відхилення оцінки зміни в знаменнику рівняння для d Коена.
  2. Використовуючи стандартне відхилення попереднього тесту в знаменнику рівняння для d Коена.

Я знайшов дуже мало літератури, яка фактично визначає, яку використовувати та / або коли використовувати будь-який варіант.

Будь-які швидкі думки?


Ви виявили, як обчислити d Коена для т-тесту для парного зразка?
користувач552231

@ user552231 Існує код R з відкритим кодом для D. Cochen's D. Ви подивилися?
HelloWorld

Відповіді:


6

Джефф Каммінг має декілька коментарів до цього питання (узятий із Cumming, 2013 ):

У багатьох випадках, однак, найкращим вибором стандартизатора є НД, необхідний для проведення висновку щодо відповідного ефекту. Розглянемо, наприклад, парний дизайн, такий як простий експеримент перед повідомленням після публікації, в якому одна група учасників надає дані як перед тестом, так і після тестування. Найбільш відповідний стандартизатор практично завжди (Cumming, 2012, pp. 290–294; Cumming & Finch, 2001, pp. 568–570) - оцінка рівня SD у популяції, що передує тестування, можливо, , найпретестніша SD в наших даних. Навпаки, для висновку про різницю потрібен , SD парних відмінностей - будь то для парного t тесту чи для обчислення CI на різницю (Cumming & Finch, 2005). Наскільки співвідносяться бали перед тестом і після тесту,s1sdiffsdiffбуде менше , наш експеримент буде більш чутливим, і значення d, обчислене помилково, використовуючи як стандартизатор, буде занадто великим.s1sdiff

Основна причина вибору в якості стандартизатора в парній конструкції полягає в тому, що SD-пакет з попереднім тестом практично завжди має найкращий концептуальний сенс як опорний блок. Іншою важливою причиною є отримання d значень, які можуть бути порівнянні зі значеннями d, заданими іншими експериментами парного проектування, можливо, що мають різні кореляції між тестом і після тестування та експериментами з різними конструкціями, включаючи дизайн незалежних груп, які вивчають той же ефект. Значення d у всіх таких випадках, ймовірно, можуть бути порівнянні, оскільки вони використовують один і той же стандартизатор - контрольний або попередній тестовий SD. Така порівнянність є важливою для мета-аналізу, а також для змістовної інтерпретації в контексті.spre


3

Я знайшов офіційну відповідь у « Межі психології» . Якщо - тестова статистика, а - кількість спостережень, то:tN

d=tN

Зауважте, що це дасть вам стандартизовану середню зміну, коли середня зміна стандартизована з точки зору стандартного відхилення балів змін (що в запитанні позначається як 1.).
Вольфганг

0

Ось запропонована R функція, яка обчислює хеджес 'g (неупереджена версія Коена d) разом з його довірчим інтервалом для або між, або всередині предмета проектування:

gethedgesg <-function( x1, x2, design = "between", coverage = 0.95) {
  # mandatory arguments are x1 and x2, both a vector of data

  require(psych) # for the functions SD and harmonic.mean.

  # store the columns in a dataframe: more convenient to handle one variable than two
  X <- data.frame(x1,x2)

  # get basic descriptive statistics
  ns  <- lengths(X)
  mns <- colMeans(X)
  sds <- SD(X)

  # get pairwise statistics
  ntilde <- harmonic.mean(ns)
  dmn    <- abs(mns[2]-mns[1])
  sdp    <- sqrt( (ns[1]-1) *sds[1]^2 + (ns[2]-1)*sds[2]^2) / sqrt(ns[1]+ns[2]-2)

  # compute biased Cohen's d (equation 1) 
  cohend <- dmn / sdp

  # compute unbiased Hedges' g (equations 2a and 3)
  eta     <- ns[1] + ns[2] - 2
  J       <- gamma(eta/2) / (sqrt(eta/2) * gamma((eta-1)/2) )
  hedgesg <-  cohend * J

  # compute noncentrality parameter (equation 5a or 5b depending on the design)
  lambda <- if(design == "between") {
    hedgesg * sqrt( ntilde/2)
  } else {
    r <- cor(X)[1,2]
    hedgesg * sqrt( ntilde/(2 * (1-r)) )
  }

  # confidence interval of the hedges g (equations 6 and 7)
  tlow <- qt(1/2 - coverage/2, df = eta, ncp = lambda )
  thig <- qt(1/2 + coverage/2, df = eta, ncp = lambda )

  dlow <- tlow / lambda * hedgesg 
  dhig <- thig / lambda * hedgesg 

  # all done! display the results
  cat("Hedges'g = ", hedgesg, "\n", coverage*100, "% CI = [", dlow, dhig, "]\n")

}

Ось як це можна використовувати:

x1 <- c(53, 68, 66, 69, 83, 91)
x2 <- c(49, 60, 67, 75, 78, 89)

# using the defaults: between design and 95% coverage
gethedgesg(x1, x2)

# changing the defaults explicitely
gethedgesg(x1, x2, design = "within", coverage = 0.90 )

Я сподіваюся, що це допомагає.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.