Різниця між випробувальним рейтингом Вілкоксона та тестом з рейтингом Вілкоксона


22

Мені було цікаво, в чому полягає теоретична різниця між тестом Ранко-Сум Вілкоксона та Тестом підписаного рангу Вілкоксона з використанням парних спостережень. Я знаю, що тест Wilcoxon Rank-Sum дозволяє проводити різну кількість спостережень у двох різних зразках, тоді як тест підписаного рейтингу для парних зразків цього не дозволяє, однак на мою думку вони обидва перевіряють те саме. Чи може хтось надати мені ще деяку довідкову / теоретичну інформацію, коли слід використовувати тест рейтингу підсумків Вілкоксона і коли слід використовувати тест рейтингу Wilcoxon з підписанням, використовуючи парні спостереження?

Відповіді:


25

Ви повинні використовувати підписаний ранг-тест, коли дані спарені .

Ви знайдете безліч визначень пари, але в основі критерій - це те, що робить пари значень принаймні дещо позитивно залежними, тоді як непарні значення не залежать. Часто спареність залежності виникає тому, що вони спостереження за однією і тією ж одиницею (повторні заходи), але це не повинно бути на одній одиниці, просто певним чином має тенденцію до асоціювання (під час вимірювання одного і того ж виду) , вважати "парними".

Ви повинні використовувати тест підсумкових рангів, коли дані не спарені.

В основному це все є.

Зауважте, що однаковий не означає, що дані є парними, а те, що відрізняються, не означає, що немає пари (можливо, кілька пар з якоїсь причини втратили спостереження). Спарювання відбувається з огляду на те, що було відібрано у вибірку.нн

Ефект від використання парного тесту, коли дані з’єднуються, полягає в тому, що він, як правило, дає більше сил для виявлення змін, які вас цікавлять. Якщо асоціація призводить до сильної залежності *, то посилення потужності може бути значним.

* конкретно, але кажучи дещо вільно, якщо розмір ефекту великий порівняно з типовим розміром парних відмінностей, але невеликий порівняно з типовим розміром непарних різниць, ви можете вибрати різницю за допомогою парного тесту на досить невеликий розмір вибірки, але з непарним тестом лише при набагато більшому розмірі вибірки.

Однак, коли дані не спарені, трактування даних як парних може бути (принаймні трохи). Однак, вартість - втрачена потужність - за багатьох обставин може бути зовсім невеликою - дослідження енергії, яке я зробив у відповідь на це питання, начебто дозволяє припустити, що в середньому втрати електроенергії в типових ситуаціях малого зразка (скажімо, для n порядку) від 10 до 30 в кожному зразку, після коригування на відмінності в рівні значущості) може бути напрочуд невеликим.

[Якщо ви якимось чином не впевнені в тому, чи є дані парними чи ні, втрати в обробці парних даних як парних зазвичай відносно незначні, тоді як виграші можуть бути значними, якщо вони спарені. Це говорить про те, що ви насправді не знаєте і маєте змогу з'ясувати, що поєднується з тим, що припускаючи, що вони спарені - наприклад, значення, що знаходяться в одному рядку таблиці, на практиці може мати сенс діяти як би дані були спарені, щоб бути безпечними - хоча деякі люди можуть, як правило, надто виконувати вас, роблячи це.]


7

Я не дослідник, хоча я є головним статистиком. Я спершу викладу вимоги до тесту підсумкового рейтингу Wilcoxon (WSRST).

  • WSRST вимагає, щоб популяції були спарені, наприклад, одна і та ж група людей тестується при двох різних випадках або речах і вимірюється на вплив кожного, а потім ми порівнюємо дві речі або випадки.
  • WSRST вимагає, щоб дані були кількісними. Кількісні дані - це дані, які вимірюються за шкалою, тому я виділив світ, виміряний у першій точці. Якби учасників попросили оцінити свої відповіді, ви будете мати справу з якісними даними, де вам потім доведеться використовувати тест на ознаки для перевірки своєї гіпотези.

[Є інші вимоги до WSRST, але ті, які я перерахував, є достатніми для розмежування двох тестів]

Тепер тест рейтингу Wilcoxon Rank (WRST)

  • Основна вимога полягає в тому, щоб зразки брали з незалежних сукупностей. Наприклад, ви можете перевірити, чи є іспитовий документ 1 важче, ніж екзаменаційний папір 2, і для цього у вас будуть дві групи студентів, і групи не повинні бути однакового розміру. З прикладу дві групи є незалежними, якщо ви попросили одну і ту ж групу написати один і той же папір двічі, ви використовуєте WSRST для перевірки своєї гіпотези.
  • Інша вимога полягає в тому, що дані не повинні бути кількісними, тобто ви також можете виконати тест на якісні дані.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.