Дуже обмежена у вас інформація, безумовно, є серйозним обмеженням! Однак речі не зовсім безнадійні.
Згідно з тими самими припущеннями, які призводять до асимптотичного розподілу для тестової статистики однойменного тесту на придатність, тестова статистика за альтернативною гіпотезою має асимптотично нецентральний розподіл χ 2 . Якщо припустити, що два подразника є а) значущими і b) мають однаковий ефект, відповідна статистика випробувань матиме однаковий асимптотичний нецентральний розподіл χ 2 . Ми можемо використовувати це , щоб побудувати тест - в основному, шляхом оцінки параметра Зміщення Л і , бачачи чи статистичні дані випробувань далеко в хвостах нецентральному х 2 ( 18 , λ )χ2χ2χ2λχ2( 18 , λ^)розповсюдження. (Це не означає, що цей тест матиме велику силу.)
Ми можемо оцінити параметр нецентральності за двома статистичними тестами, взявши їх середню величину і віднісши ступінь свободи (методи оцінки моментів), давши оцінку 44, або за максимальною ймовірністю:
x <- c(45, 79)
n <- 18
ll <- function(ncp, n, x) sum(dchisq(x, n, ncp, log=TRUE))
foo <- optimize(ll, c(30,60), n=n, x=x, maximum=TRUE)
> foo$maximum
[1] 43.67619
Гарна згода між нашими двома оцінками, насправді не дивно, якщо врахувати два пункти даних та 18 градусів свободи. Тепер обчислимо р-значення:
> pchisq(x, n, foo$maximum)
[1] 0.1190264 0.8798421
Отже наше p-значення 0,12, недостатнє для відкидання нульової гіпотези про те, що два подразника однакові.
λχ2( λ - δ, λ + δ)δ= 1 , 2 , … , 15δ і подивіться, як часто наш тест відмовляється на, скажімо, рівні 90% та 95% довіри.
nreject05 <- nreject10 <- rep(0,16)
delta <- 0:15
lambda <- foo$maximum
for (d in delta)
{
for (i in 1:10000)
{
x <- rchisq(2, n, ncp=c(lambda+d,lambda-d))
lhat <- optimize(ll, c(5,95), n=n, x=x, maximum=TRUE)$maximum
pval <- pchisq(min(x), n, lhat)
nreject05[d+1] <- nreject05[d+1] + (pval < 0.05)
nreject10[d+1] <- nreject10[d+1] + (pval < 0.10)
}
}
preject05 <- nreject05 / 10000
preject10 <- nreject10 / 10000
plot(preject05~delta, type='l', lty=1, lwd=2,
ylim = c(0, 0.4),
xlab = "1/2 difference between NCPs",
ylab = "Simulated rejection rates",
main = "")
lines(preject10~delta, type='l', lty=2, lwd=2)
legend("topleft",legend=c(expression(paste(alpha, " = 0.05")),
expression(paste(alpha, " = 0.10"))),
lty=c(1,2), lwd=2)
що дає наступне:
Дивлячись на справжні нульові точки гіпотези (значення осі x = 0), ми бачимо, що тест є консервативним, оскільки він, здається, не відкидає так часто, як вказував би рівень, але не переважно. Як ми і очікували, він не має великої потужності, але краще, ніж нічого. Цікаво, чи є кращі тести там, враховуючи дуже обмежену кількість наявної у вас інформації.