Чи можливо провести аналіз потужності для тесту Крускала-Уолліса та Манна-Вітні U? Якщо так, чи є R-пакети / функції, які виконують його?
Чи можливо провести аналіз потужності для тесту Крускала-Уолліса та Манна-Вітні U? Якщо так, чи є R-пакети / функції, які виконують його?
Відповіді:
Звичайно, можна розрахувати потужність.
Якщо бути більш конкретним - якщо ви зробите достатні припущення, щоб отримати ситуацію, в якій ви зможете обчислити (певним чином) ймовірність відхилення, ви можете обчислити потужність.
У Вілкоксоні-Манні-Вітні, якщо (наприклад) ви припускаєте форми розподілу (зробіть припущення про форму (форми) розподілу) і зробите певне припущення про масштаби (розвороти) та конкретні значення розташування або різниці в місцях розташування , можливо, ви зможете обчислити потужність або алгебраїчно, або за допомогою чисельної інтеграції; в противному випадку ви можете імітувати швидкість відхилення.
Так, наприклад, якщо ми припускаємо вибірку з розподілів із заданою різницею розташування (стандартизована для загальної шкали), то, враховуючи розміри вибірки, ми могли б імітувати безліч наборів даних, що відповідають усім цим умовам, і таким чином отримувати оцінку швидкості відхилення. Тож припустимо, що у нас є два зразки розподілів (сімейство масштабів розташування) з одиничною шкалою ( ) - без втрати загальності - і з різницею розташування . Знову ж таки, без втрати загальності ми могли б прийняти
n1=6;n2=9;tdf=5;delta=1;al=0.05;nsim=10000
res = replicate(nsim,{y1=rt(n1,tdf);y2=rt(n2,tdf)+delta;wilcox.test(y1,y2)$p.value<=al})
mean(res) # res will be logical ("TRUE" = reject); mean is rej rate
Виконуючи це для багатьох значень зміни місця розташування, ви навіть можете отримати криву потужності для цього набору обставин, коли зміна місця розташування змінюється, якщо ви хочете.
Зауважимо, що хоча ці тести не є розподільними (для постійних розподілів) під нулем, поведінка відрізняється за різних припущень розподілу для альтернатив.
Ситуація для Крускала-Уолліса схожа, але у вас є більше зрушень місцеположення (або будь-якої іншої ситуації, яку ви дивитесь) для уточнення.
Діаграма у цій відповіді показує порівняння кривої потужності для парного t-випробування проти модельованої потужності для підписаного тесту рангу при конкретному розмірі вибірки через різноманітні стандартизовані зрушення місцеположення для вибірки від звичайних розподілів із заданим співвідношенням між парами. Аналогічні розрахунки можна зробити для Манна-Вітні та Крускала-Уолліса.
У мене було точно таке ж питання, як і у вас. Після трохи пошуку я знайшов цей пакет: https://cran.r-project.org/web/packages/MultNonParam/MultNonParam.pdf
kwpower (nreps, зрушення, distname = c ("нормальний", "логістичний"), рівень = 0,05, mc = 0, taylor = FALSE)
nreps: цифри в кожній групі.
зрушення: компенсації для різних груп населення за альтернативною гіпотезою.
distname: розподіл основних спостережень; нормальні та логістичні в даний час підтримуються.
рівень: рівень тесту.
mc: 0 для асимптотичного обчислення, або додатне для наближення mc. Тейлор: логічне визначення, чи застосовується наближення рядів Тейлора для ймовірностей.