Аналіз потужності для тесту Kruskal-Wallis або Mann-Whitney U з використанням R?


14

Чи можливо провести аналіз потужності для тесту Крускала-Уолліса та Манна-Вітні U? Якщо так, чи є R-пакети / функції, які виконують його?


Це може бути корисно: stats.stackexchange.com/questions/65808/…

У Р. є пакет pwr. Але це не робить випробування сили Крускала-Уолліса.
Гонг Чжан

Відповіді:


3

Звичайно, можна розрахувати потужність.

Якщо бути більш конкретним - якщо ви зробите достатні припущення, щоб отримати ситуацію, в якій ви зможете обчислити (певним чином) ймовірність відхилення, ви можете обчислити потужність.

У Вілкоксоні-Манні-Вітні, якщо (наприклад) ви припускаєте форми розподілу (зробіть припущення про форму (форми) розподілу) і зробите певне припущення про масштаби (розвороти) та конкретні значення розташування або різниці в місцях розташування , можливо, ви зможете обчислити потужність або алгебраїчно, або за допомогою чисельної інтеграції; в противному випадку ви можете імітувати швидкість відхилення.

Так, наприклад, якщо ми припускаємо вибірку з розподілів із заданою різницею розташування (стандартизована для загальної шкали), то, враховуючи розміри вибірки, ми могли б імітувати безліч наборів даних, що відповідають усім цим умовам, і таким чином отримувати оцінку швидкості відхилення. Тож припустимо, що у нас є два зразки розподілів (сімейство масштабів розташування) з одиничною шкалою ( ) - без втрати загальності - і з різницею розташування . Знову ж таки, без втрати загальності ми могли б прийнятиt5t5σ=1δ=μ2μ1=1μ1=0n1=6,n2=9δ/σ1

n1=6;n2=9;tdf=5;delta=1;al=0.05;nsim=10000
res = replicate(nsim,{y1=rt(n1,tdf);y2=rt(n2,tdf)+delta;wilcox.test(y1,y2)$p.value<=al})
mean(res)  # res will be logical ("TRUE" = reject); mean is rej rate

nδ

Виконуючи це для багатьох значень зміни місця розташування, ви навіть можете отримати криву потужності для цього набору обставин, коли зміна місця розташування змінюється, якщо ви хочете.

n1n2σ2δ/σδnn1biδ=δiΦ1(1b)δδδnδ

P(Y2>Y1)

Зауважимо, що хоча ці тести не є розподільними (для постійних розподілів) під нулем, поведінка відрізняється за різних припущень розподілу для альтернатив.

Ситуація для Крускала-Уолліса схожа, але у вас є більше зрушень місцеположення (або будь-якої іншої ситуації, яку ви дивитесь) для уточнення.

Діаграма у цій відповіді показує порівняння кривої потужності для парного t-випробування проти модельованої потужності для підписаного тесту рангу при конкретному розмірі вибірки через різноманітні стандартизовані зрушення місцеположення для вибірки від звичайних розподілів із заданим співвідношенням між парами. Аналогічні розрахунки можна зробити для Манна-Вітні та Крускала-Уолліса.


1

У мене було точно таке ж питання, як і у вас. Після трохи пошуку я знайшов цей пакет: https://cran.r-project.org/web/packages/MultNonParam/MultNonParam.pdf

kwpower (nreps, зрушення, distname = c ("нормальний", "логістичний"), рівень = 0,05, mc = 0, taylor = FALSE)

nreps: цифри в кожній групі.

зрушення: компенсації для різних груп населення за альтернативною гіпотезою.

distname: розподіл основних спостережень; нормальні та логістичні в даний час підтримуються.

рівень: рівень тесту.

mc: 0 для асимптотичного обчислення, або додатне для наближення mc. Тейлор: логічне визначення, чи застосовується наближення рядів Тейлора для ймовірностей.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.