Критичні значення Вілкоксона-Манна-Вітні в R


10

Я помітив, що коли я намагаюся знайти критичні значення для Mann-Whitney U за допомогою R, значення завжди становлять 1 + критичне значення. Наприклад, для критичне значення (двохвосте) становить 8, тоді як для , ((двохвостий) ) критичне значення - 22 (перевірте таблиці ), але:α = .05 , n = 12 , m = 8α=.05,n=10,m=5α=.05,n=12,m=8

> qwilcox(.05/2,10,5)
[1] 9
> qwilcox(.05/2,12,8)
[1] 23

Звичайно, я щось не розглядаю, але ... хтось міг би мені пояснити, чому?

Відповіді:


17

Я думаю, що тут може відповісти, що ви порівнюєте яблука та апельсини.

Нехай позначає cdf статистики Манна-Вітніє функція квантиля з . За визначенням, це F(x)UqwilcoxQ(α)U

Q(α)=inf{xN:F(x)α},α(0,1).

Оскільки дискретний, зазвичай немає такого, що , тому зазвичай .UxF(x)=αF(Q(α))>α

Тепер розглянемо критичне значення для тесту. У цьому випадку, ви хочете , так як в противному випадку ви будете мати тест з частотою помилок типу I , який більше , ніж номінальна. Зазвичай це вважається небажаним; консервативні тести мають перевагу. Отже, Якщо не існує такого, що , то ми маємо .C(α)F(C(α))α

C(α)=sup{xN:F(x)α},α(0,1).
xF(x)=αC(α)=Q(α)1

Причиною розбіжності є те, що qwilcoxбуло розроблено для обчислення квантів, а не критичних значень!


1
(+1) Хороший, простий, стислий опис. :)
кардинал

2

Пам’ятайте, що статистика тестування суми рангів дискретна, і тому вам потрібно використовувати критичне значення, таким, що ймовірність хвоста дорівнює вказаному . Для деяких розмірів вибірки, рівних альфа, неможливо досягти, і це я здогадуюсь, чому вам потрібен +1.α


4
То чому ж +1 потрібен у R, а не у звичайних таблицях?
MånsT

1
@ this.is.not.a.nick: можливо, що важливіше, тоді як , що означає, що в першому випадку фактичний рівень значущості буде а в другому - . Зазвичай люди, як правило, вважають за краще помилятися з правого боку, тобто мають нижчий рівень значущості, ніж номінальний (тобто значення з таблиць є кращими). 0.0236723<0.0250.02868937>0.025<0.05>0.05
MånsT

1
Право як на Прокрастинатора, так і на MansT. Насправді визначення рівня значущості вимагає, щоб хвостові ймовірності не дорівнювали ніщому, що перевищує альфа. Про це я розповідаю у своїй роботі з Крістін Лю про пилячу поведінку функції живлення для точних біноміальних тестів методом Клоппера-Пірсона (див. Американський статистик (2002)).
Майкл Р. Черник

2
@Michael: На цій же сторінці, що і ця. Таблиці відповідають стандартному визначенню, що означає, що критичні значення не є квантовими.
MånsT

3
@Michael: Погоджено. У певному сенсі qwilcoxробить те, що має робити, але не те, що ви цього очікували.
MånsT
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.