Чи W статистичний вихід по wilcox.test () в R такий самий, як U статистичний?

Я нещодавно читав про тест Манна-Вітні U. Виявляється, що для проведення цього тесту на R фактично потрібно запустити тест Вілкоксона!

Моє запитання: чи W статистика W wilcox.testв R тотожна U статистиці?

r wilcoxon-mann-whitney

— лучано
джерело

Відповіді:

Зазвичай Вілкоксону приписують те, що він був первинним винахідником тесту *, хоча підхід Манна та Уітні був великим кроком вперед, і вони розширили випадки, за якими було складено статистику. Моя перевага - позначати тест як Вілкоксона-Манна-Вітні, щоб визнати обидва внески (Ман-Уітні-Вілкоксон також видно; я теж не заперечую проти цього).

* Однак фактична картина трохи похмуріша, тому що кілька інших авторів також створюють однакові або подібні статистичні дані про цей час чи раніше, або в деяких випадках роблять внески, тісно пов'язані з тестом. Принаймні частина кредиту повинна піти в інше місце.

Тест Вілкоксона і тест Манна-Вітні U є рівнозначними (і довідка стверджує, що вони є) тим, що вони завжди відкидають одні й ті ж випадки за тих же обставин; щонайбільше їх тестова статистика відрізнятиметься лише зміщенням (а в деяких випадках - просто можливою зміною ознак).

Випробування Вілкоксона в літературі визначено більш ніж одним способом (і ця неоднозначність походить від початкової таблиці статистики тесту, більше ніж за мить), тому треба подбати про те, з яким тестом Вілкоксона йде мова.

У цій парі публікацій обговорюються дві найпоширеніші форми визначення:

Тест Уілкоксона за рангом у R

Різні способи обчислити статистику тесту для тесту суми рангів Вілкоксона

Щоб вирішити, що конкретно відбувається в R:

Статистичні дані, використані wilcox.testв R, визначені у довідці ( ?wilcox.test), і питання про відношення до статистики Манна-Вітні U пояснюється там:

Література не є одностайною щодо визначень суми рангів Вілкоксона та тестів Манна-Вітні

Два найпоширеніших визначення відповідають сумі рангів першого вибірки з віднятим мінімальним значенням чи ні: R віднімає, а S-PLUS не робить, даючи значення, яке більше на m (m + 1) / 2 для a перший зразок розміром m. (Здається, в оригінальному документі Вілкоксона використовувались невідрегульовану суму рангів, але наступні таблиці віднімали мінімум.)

Значення R також можна обчислити як кількість усіх пар, (x[i], y[j])для яких y[j]не більше, ніж x[i]найпоширеніше визначення тесту Манна-Вітні.

Останнє речення повністю відповідає тому аспекту вашого запитання - версія W, яку виводить R *, також є значенням U.

* Сума рангів у зразку 1, мінус найменше значення, яке воно може приймати (тобто мінус ). $\frac{n_1(n_1+1)}{2}$

— Glen_b -Встановити Моніку
джерело

І тест суми рангів Вілкоксона, і тест Манна-Вітні є непараметричними еквівалентами незалежного t-тесту . У деяких випадках версія W, яку дає R, також є значенням U. Але не у всіх випадках.

Коли ви використовуєте: wilcox.test(df$var1 ~ df$var2, paired=FALSE)даний W збігається з U. Таким чином, ви можете повідомити про це як статистику Манна-Вітні U.

Однак, коли ви використовуєте:, wilcox.test(df$var1 ~ df$var2, paired=TRUE)ви фактично виконуєте тест з підписанням Вілкоксона. Підписаний Вілкоксоном ранг тест є еквівалентом залежного t-тесту .

Джерело: "Статистичні дані з використанням R" від Andy Field (2013)

— Яап
джерело

Хороша ідея зазначити, що якщо ви використовуєте аргумент, paired=TRUEце не Уілкоксон-Ман-Уітні, а підписаний ранг.

— Glen_b -Встановіть Моніку

Зауважте, що код: wilcox.test(df$var1 ~ df$var2, paired=FALSE)(використовуючи '~')

створить іншу статистику W, ніж: wilcox.test(df$var1, df$var2, paired=FALSE)(використовуючи ',')

— Тілен
джерело

Ласкаво просимо на сайт, @Tilen. Чи це було задумано як відповідь на запитання ОП, коментар із запитом роз'яснення від ОП чи одного з відповідачів, або нове власне питання? Будь ласка, використовуйте лише поле "Ваша відповідь", щоб дати відповіді на початкове запитання. Ви зможете коментувати будь-де, коли ваша репутація буде> 50. Якщо у вас є нове запитання, натисніть сірий ASK QUESTION у верхній частині сторінки і задайте його там, тоді ми можемо допомогти вам належним чином. Оскільки ви тут новачок, ви можете скористатися нашою екскурсією , де є інформація для нових користувачів.

— gung - Відновіть Моніку

Велике спасибі @gung. Дійсно, це було як відповідь, так і питання, я думаю. Дякую за поради. Я з нетерпінням чекаю бути частиною цього.

— Тілен

"Відповіді" - це лише прямі відповіді на питання. Чи можете ви відредагувати це, щоб зробити це більш чистою відповіддю?

— gung - Відновіть Моніку

Вибач за це. Я редагував це зараз. Це краще виглядає зараз?

— Тілен

Не потрібно вибачатися. Я думаю, що ваша відповідь мається на увазі в тому, що ви тут виклали, але людям доведеться читати між рядків. Чи можете ви зробити це явним і зв'язати все в лук? Однак я не впевнений, що це правильно. Для використання версії формули вам потрібен вектор значень & індикатор групування. Наприклад, wilcox.test(values~ind, with(df, stack(var1=var1, var2=var2)), paired=FALSE). Коли я це роблю, я отримую однакові Wобидва способи.

— gung - Відновіть Моніку