Я намагаюся зрозуміти розрахунок потужності для випадку двох незалежних пробних тестів (не передбачаючи рівних дисперсій, тому я використовував Satterthwaite).
Ось діаграма, яку я знайшов, щоб допомогти зрозуміти процес:
Тож я припустив, що враховуючи наступне про дві популяції та розміри вибірки:
mu1<-5
mu2<-6
sd1<-3
sd2<-2
n1<-20
n2<-20
Я міг обчислити критичне значення під нульовим значенням, пов’язаним із наявністю 0,05 верхньої ймовірності хвоста:
df<-(((sd1^2/n1)+(sd2^2/n2)^2)^2) / ( ((sd1^2/n1)^2)/(n1-1) + ((sd2^2/n2)^2)/(n2-1) )
CV<- qt(0.95,df) #equals 1.730018
а потім обчислити альтернативну гіпотезу (що для цього випадку я дізнався, як "не центральний розподіл t"). Я розраховував бета-версію на діаграмі вище, використовуючи не центральне розподілення та критичне значення, знайдене вище. Ось повний сценарій на R:
#under alternative
mu1<-5
mu2<-6
sd1<-3
sd2<-2
n1<-20
n2<-20
#Under null
Sp<-sqrt(((n1-1)*sd1^2+(n2-1)*sd2^2)/(n1+n2-2))
df<-(((sd1^2/n1)+(sd2^2/n2)^2)^2) / ( ((sd1^2/n1)^2)/(n1-1) + ((sd2^2/n2)^2)/(n2-1) )
CV<- qt(0.95,df)
#under alternative
diff<-mu1-mu2
t<-(diff)/sqrt((sd1^2/n1)+ (sd2^2/n2))
ncp<-(diff/sqrt((sd1^2/n1)+(sd2^2/n2)))
#power
1-pt(t, df, ncp)
Це дає значення потужності 0,4935132.
Це правильний підхід? Я вважаю, що якщо я використовую інше програмне забезпечення для розрахунку потужності (наприклад, SAS, яке, на мою думку, я встановив рівнозначно моїй проблемі нижче), я отримую іншу відповідь (від SAS це 0,33).
SAS КОД:
proc power;
twosamplemeans test=diff_satt
meandiff = 1
groupstddevs = 3 | 2
groupweights = (1 1)
ntotal = 40
power = .
sides=1;
run;
Зрештою, я хотів би зрозуміти, що дозволило б розглянути симуляції для складніших процедур.
EDIT: Я виявив свою помилку. повинно було
1-pt (CV, df, ncp) НЕ 1-pt (t, df, ncp)