Ефект розміру для підписаного рангу Вилкоксона?


18

Деякі автори (наприклад, Pallant, 2007, стор. 225; див. Зображення нижче) пропонують обчислити розмір ефекту для тестування рангом, підписаним Вілкоксоном, поділивши статистику тесту на квадратний корінь на кількість спостережень:

r=Znx+ny

Z- це тестовий статистичний результат по SPSS (див. зображення нижче), а також по wilcoxsign_testR. (Дивіться також моє відповідне питання: teststatistic vs linearstatistic in wilcoxsign_test )

Інші пропонують Брава-Пірсона ( r=cov(XY)sd(X)×sd(Y) ) абокоефіцієнти кореляціїSpearman (rS) (залежно від типу даних).

Коли ви їх обчислюєте, два rs навіть не віддалено однакові. Наприклад, для моїх поточних даних:

r = 0,23 (для r=Znx+ny )

r = 0,43 (Пірсон)

Це означало б різний розмір ефекту.

Отже, який правильний розмір ефекту використовувати, і як вони rстосуються один одного?


Сторінки 224 (нижня частина) та 225 від Pallant, J. (2007). Посібник з виживання SPSS:

введіть тут опис зображення

введіть тут опис зображення



3
Я набагато краще залишити його таким, яким він є - якщо Бравайс заслуговує на одну мову, він заслуговує на іншій! Я ціную заповнення прогалини в моїй освіті.
Glen_b -Встановіть Моніку

1
Так, тому що мені потрібен тест, який може впоратися зі зв’язками.

2
Інструкція в книзі, яку я цитую у своєму коментарі вище (Pallant, 2007, стор. 225), говорить про те, що nвnn=nx+ny

1
Я особисто думав, що Z / sqrt (n) може бути одним із варіантів. Вікіпедія про Манн-Вітні посилається на PDF-документ Кірбі, який також вважає парним Вілкоксоном; Я сам не читав статті.
ttnphns

Відповіді:


6
  • Якщо у вас немає зв’язків, я б повідомив про частку після значень, менших за відповідні перед значеннями.
  • Якщо у вас є зв’язки, ви можете повідомити про частку після значень, менших, ніж раніше, від загальної кількості не пов'язаних пар, або повідомити про всі три пропорції (<, =,>) і, можливо, суму того, що було два більш змістовне. Наприклад, можна сказати, що «33% мали менше страху перед статистикою, 57% були незмінними, а 10% - більше страху після курсу, так що 90% були такими ж або кращими, ніж раніше».

NzNz/Nz/N

Однак є ще одна зморшка. Хоча ви хочете оцінити розмір загального ефекту, люди зазвичай використовують тест рангового підпису Вілкоксона з даними, які мають лише порядковий характер. Тобто там, де вони не вірять, що дані можуть достовірно вказувати на величину зсуву всередині студента, але лише, що відбувся зсув. Це підводить мене до пропорції, вдосконаленої, про яку говорилося вище.


З іншого боку, якщо ви впевнені в тому, що значення є внутрішньо значущими (наприклад, ви використовували лише підписаний тест на рангові показники для його стійкості до нормальності та перешкод), ви можете просто використовувати необмежену середню або середню різницю або стандартизовану середню різницю як міра ефекту.


2
+1 Ваші запропоновані заходи впливу легко зрозуміти, а також пов'язані зі статистикою тесту.
Іван

2

Не знаючи, які дані оцінюються, тут дуже важко дати хороші поради. І справді, це все, що можна отримати. Просто немає такого поняття, як найкращий показник розміру ефекту для таких питань ... можливо, коли-небудь.

Розміри ефектів, згадані у питанні, - це всі стандартизовані розміри ефектів. Але цілком можливо, що засоби або посередники оригінальних заходів є просто чудовими. Наприклад, якщо ви вимірюєте, скільки часу займає виробничий процес, то різниця в часі має бути абсолютно розумним розміром ефекту. Будь-які зміни в процесі, майбутні вимірювання, вимірювання в системах та вимірювання на заводах будуть вчасно. Можливо, ви хочете середній або, можливо, ви хочете середній або рівний режим, але перше, що вам потрібно зробити, це подивитися на фактичну шкалу вимірювання і побачити, чи є розмір ефекту розумним для інтерпретації і сильно пов'язаний з вимірюванням.

Щоб допомогти подумати над цим, ефекти, які слід стандартизувати, - це речі, які вимірюються більш опосередковано та багато в чому. Наприклад, психологічні шкали можуть змінюватись у часі та різними способами та намагатися дістати нижчу змінну, яка безпосередньо не оцінюється. У цих випадках потрібно стандартизовані розміри ефектів.

При стандартизованих розмірах ефектів критичним питанням є не лише те, що використовувати, а що вони означають. Як ви розумієте у своєму запитанні, ви також не знаєте, що вони означають, і це важливо. Якщо ви не знаєте, що таке стандартизований ефект, то ви не можете повідомити про нього правильно, інтерпретувати його чи правильно використовувати. Крім того, якщо ви хочете обговорити дані різними способами, абсолютно нічого не заважає вам повідомляти більше, ніж один розмір ефекту. Ви можете обговорити свої дані з точки зору лінійних взаємозв'язків, як, наприклад, зі співвідношенням моментів продукту або з точки зору взаємозв'язку між рядами з Spearmanrта відмінності між ними або просто надайте всю інформацію в таблиці. В цьому немає нічого поганого. Але більше, ніж усе, вам доведеться вирішити, що ви хочете, щоб означали ваші результати. Це те, на що не можна відповісти за наданою інформацією, і це може зажадати набагато більше інформації та доменних знань, ніж це розумно для запитання на цьому форумі.

І завжди думайте мета-аналітично про те, як ви повідомляєте про ефекти. Чи зможуть люди в майбутньому приймати результати, про які я повідомляю, та інтегрувати їх з іншими? Можливо, у вашому полі є стандарт для цих речей. Можливо, ви вибрали непараметричний тест насамперед тому, що не довіряєте висновкам, які зробили інші щодо базових розподілів, і ви хочете бути більш консервативними у своїх припущеннях у полі, яке в першу чергу використовує параметричні тести. У цьому випадку немає нічого поганого в додатковому наданні розміру ефекту, який зазвичай використовується для параметричних тестів. Ці та багато інших питань потрібно враховувати, роздумуючи про те, як ви розміщуєте свої висновки у більшій літературі подібних досліджень. Зазвичай хороші описові статистичні дані вирішують ці проблеми.

Тож це первинна порада. У мене є кілька додаткових коментарів. Якщо ви хочете, щоб ваш розмір ефекту був сильно пов'язаний з тестом, який ви зробили, тоZ , очевидно, найкраща рекомендація. Ваш стандартизований розмір ефекту означатиме те саме, що і тест. Але як тільки ви цього не робите, тоді немає нічого поганого в тому, щоб використовувати більшість нічого іншого, навіть щось на зразок Коенаd що пов'язано з параметричними тестами. Немає припущення щодо нормальності обчислення засобів, стандартних відхилень абоdбалів. Насправді є більш слабкі припущення, ніж для рекомендованого коефіцієнта кореляції. І завжди повідомляйте про хороші описові заходи. Знову ж таки, описові заходи не мають припущень, які ви порушите, але пам’ятайте про їх змістовне значення. Ви повідомляєте описову статистику, яка говорить щось про ваші дані, які ви хочете сказати, і засоби, а медіани говорять різні речі.

Якщо ви хочете обговорити повторні заходи щодо незалежних розмірів ефекту дизайну, це справді зовсім нове питання.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.