Пошук сили проти експоненціальних альтернатив зміщення масштабу досить просто.
Однак я не знаю, що вам слід використовувати значення, обчислені з ваших даних, щоб визначити, яка потужність могла бути. Подібний пост-спеціальний розрахунок потужності, як правило, призводить до контрінтуїтивних (а може бути оманливих) висновків.
Влада, як рівень значущості, - це явище, з яким ви маєте справу перед фактом; ви б використали апріорне розуміння (включаючи теорію, міркування чи будь-які попередні дослідження), щоб визначитися з розумним набором альтернативних варіантів і бажаним розміром ефекту
Ви також можете розглянути цілий ряд інших альтернатив (наприклад, ви могли б вбудувати експоненцію всередині сімейства гамма, щоб врахувати вплив більш-менш випадків перекосу).
Звичайні питання, на які можна спробувати відповісти шляхом аналізу потужності:
1) яка потужність для заданого розміру вибірки для якогось ефекту чи набору розмірів ефекту *?
2) з огляду на розмір вибірки та потужність, наскільки великий ефект виявляється?
3) Враховуючи бажану потужність для конкретного розміру ефекту, який розмір вибірки потрібен?
* (де тут "розмір ефекту" призначений загально, і це може бути, наприклад, певне співвідношення засобів або різниця засобів, не обов'язково стандартизованих).
Очевидно, що ви вже маєте розмір вибірки, тому вам не в цьому випадку (3). Ви можете обґрунтовано розглянути випадок (2) або випадок (1).
Я б запропонував випадок (1) (який також дає спосіб впоратися із справою (2)).
Щоб проілюструвати підхід до справи (1) та побачити, як він стосується випадку (2), розглянемо конкретний приклад із:
альтернативи зміщення масштабу
експоненціальні популяції
розміри вибірки у двох зразках 64 та 54
Оскільки розміри вибірки різні, ми маємо розглянути випадок, коли відносне розкид в одному з зразків є і меншим, і більшим за 1 (якщо вони були однакового розміру, симетричні міркування дозволяють розглядати лише одну сторону). Однак, оскільки вони досить близькі до однакових розмірів, ефект дуже малий. У будь-якому випадку зафіксуйте параметр для однієї вибірки та змініть інший.
Отже, що робити:
Заздалегідь:
choose a set of scale multipliers representing different alternatives
select an nsim (say 1000)
set mu1=1
Щоб виконати розрахунки:
for each possible scale multiplier, kappa
repeat nsim times
generate a sample of size n1 from Exp(mu1) and n2 from Exp(kappa*mu1)
perform the test
compute the rejection rate across nsim tests at this kappa
У R я зробив це:
alpha = 0.05
n1 = 54
n2 = 64
nsim = 10000
s = c(1.1,1.2,1.5,2,2.5,3) # set up grid for kappa
s = c(1/rev(s),1,s) # also below and at 1
rr = array(NA,length(s)) # to hold rejection rates
for(i in seq_along(s)) rr[i]=mean(replicate(nsim,
ks.test(rexp(n1,1),rexp(n2,s[i]))$p.value)<alpha
)
plot(rr~s,log="x",ylim=c(0,1),type="n") #set up plot
points(rr~rev(s),col=3) # plot the reversed case to show the (tiny) asymmetry+noise
points(rr~s,col=1) # plot the "real" case last
abline(h=alpha,col=8,lty=2) # draw in alpha
яка дає наступну потужність "крива"
Вісь x знаходиться в масштабі журналу, вісь y - швидкість відхилення.
Тут важко сказати, але чорні точки трохи вище зліва, ніж справа (тобто є частково більше потужності, коли більший зразок має менший масштаб).
Використовуючи обернену нормальну cdf як перетворення швидкості відхилення, ми можемо скласти залежність між трансформованою швидкістю відхилення та log kappa (kappa є s
в графіку, але вісь x масштабується) дуже майже лінійною (за винятком близько 0 ), а кількість симуляцій була достатньо високою, що шум дуже низький - ми можемо просто ігнорувати його в сучасних цілях.
Тож ми можемо просто використовувати лінійну інтерполяцію. Нижче показано приблизні розміри ефектів для 50% та 80% потужності для ваших розмірів вибірки:
Розміри ефектів з іншого боку (більша група має менший масштаб) лише злегка зміщені від цього (можна підібрати частково менший розмір ефекту), але це має незначну різницю, тому я не буду працювати на цьому.
Таким чином, тест дозволить отримати істотну різницю (від співвідношення шкал 1), але не малу.
Тепер для коментарів: я не думаю, що тести гіпотези особливо актуальні для основного питання, що цікавить ( чи вони досить схожі? ), І, отже, ці розрахунки потужності не говорять нам про щось, що має безпосереднє значення для цього питання.
Я думаю, ви вирішуєте це корисніше питання, уточнюючи, що, на вашу думку, «по суті те саме» насправді означає оперативно. Це - раціонально спрямоване на статистичну діяльність - повинно призвести до змістовного аналізу даних.