Тест Барнард використовується, коли параметр неприємності невідомий під нульовою гіпотезою.
Однак у тесті дегустації леді ви можете стверджувати, що параметр неприємностей може бути встановлений у 0,5 під нульовою гіпотезою (необізнана дама має 50% ймовірності правильно відгадати чашку).
Тоді кількість правильних здогадок, під нульовою гіпотезою, набуває біноміального розподілу: відгадуючи 8 чашок з 50% ймовірністю для кожної чашки.
В інших випадках у вас може не виникнути такої тривіальної 50% ймовірності для нульової гіпотези. І без фіксованих запасів ви можете не знати, якою має бути така ймовірність. У такому випадку вам потрібен тест Барнарда.
Навіть якщо ви зробите тест Барнарда на тесті чаю з леді, вона все одно стане 50% (якщо результат є правильним здогадом), оскільки параметр неприємності з найвищим значенням p дорівнює 0,5 і призведе до тривіального біноміального тесту ( насправді це поєднання двох біноміальних тестів, одного для чотирьох перших чашок молока та одного для чотирьох перших чашок чаю).
> library(Barnard)
> barnard.test(4,0,0,4)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 0
Outcome II 0 4
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -2.82843
Nuisance parameter = 0.5 (One sided), 0.5 (Two sided)
P-value = 0.00390625 (One sided), 0.0078125 (Two sided)
> dbinom(8,8,0.5)
[1] 0.00390625
> dbinom(4,4,0.5)^2
[1] 0.00390625
Нижче - як би досягти складнішого результату (якщо не всі здогадки правильні, наприклад, 2 проти 4), то підрахунок того, що є, а що не є крайнім, стає дещо складнішим.
(Зауважте також, що тест Барнард використовує, у випадку результату 4-2, параметр неприємності p = 0,686, який ви можете стверджувати, що не є правильним, значення p для 50% ймовірності відповіді "чай першим" буде 0,08203125. Це стає ще менше, якщо розглядати інший регіон, а не той, який базується на статистиці Вальда, хоча визначити регіон не так просто )
out <- rep(0,1000)
for (k in 1:1000) {
p <- k/1000
ps <- matrix(rep(0,25),5) # probability for outcome i,j
ts <- matrix(rep(0,25),5) # distance of outcome i,j (using wald statistic)
for (i in 0:4) {
for (j in 0:4) {
ps[i+1,j+1] <- dbinom(i,4,p)*dbinom(j,4,p)
pt <- (i+j)/8
p1 <- i/4
p2 <- j/4
ts[i+1,j+1] <- (p2-p1)/sqrt(pt*(1-pt)*(0.25+0.25))
}
}
cases <- ts < ts[2+1,4+1]
cases[1,1] = TRUE
cases[5,5] = TRUE
ps
out[k] <- 1-sum(ps[cases])
}
> max(out)
[1] 0.08926748
> barnard.test(4,2,0,2)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 2
Outcome II 0 2
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -1.63299
Nuisance parameter = 0.686 (One sided), 0.314 (Two sided)
P-value = 0.0892675 (One sided), 0.178535 (Two sided)