У якій ситуації тест Вілкоксона з підписаним рейтингом буде кращим перед тестом t або тестуванням знаків?


10

Після деякої дискусії (нижче) у мене зараз чіткіше уявлення про цілеспрямоване питання, тому ось переглянуте питання, хоча деякі коментарі можуть здатися непов'язаними з початковим запитанням.

Здається, що t-тести швидко сходяться для симетричних розподілів , що підписаний ранг передбачає симетрію , а для симетричного розподілу немає різниці між засобами / псевдомедіанами / медіанами. Якщо так, то за яких обставин порівняно недосвідчений статистик вважає тест підписаного рангу корисним, коли s / у нього є і тест t та тест знаків? Якщо хтось із моїх (наприклад, суспільствознавчих) студентів намагається перевірити, чи одне лікування діє краще, ніж інше (якимсь відносно легко інтерпретованим мірилом, наприклад, якимсь поняттям "середня" різниця), я намагаюся знайти місце для підписаних- тест на рангову оцінку, хоча, як здається, в моєму університеті, як правило, викладають, а тест з ознаками ігнорують.


1
Джамме: звичайно, я про це не думав.
JonB

1
Це залежить від того , на чию загальноприйняту мудрість ви дивитесь; мій досвід цього дуже відрізняється від вашого. Безумовно, легко знайти ресурси, які чітко стверджують, що симетричність балів різниці передбачається під нуль (і що це має значення). Але зауважте, що це під нулем - як результат, виявлення відсутності симетрії в різницевих балах у вибірці не обов'язково має значення - вам не потрібно мати симетричність під альтернативою. Якщо ви впевнені, що якби нуль був правдивим, то симетрія буде дотримана - і в багатьох випадках це дуже правдоподібне припущення - ...
ctd

1
ctd ... тоді немає жодної проблеми. Проблема полягає в тому, що якщо ви не готові заздалегідь припустити це, ви не знаєте, чи було відхилення спричинене невдачею припущення; очевидно, що робити тоді - просто не припускати цього.
Glen_b -Встановити Моніку

2
Переглянувши свій другий коментар спочатку: (поверх того, що ви вже згадували), зверніть увагу, що 1. нормальні припущення не вичерпують параметричних тестів. 2. Підписаний рейтинговий тест насправді не є тестом на медіанів, а на одних зразках статистики Ходжеса-Леманна / псевдомедіанів (хоча якщо додати припущення про симетрію до альтернативи, він також перевірятиме медіани, і де існують засоби, також для засобів, між іншим). Аналогічно тест за ранговою сумою не є тестом на медіани, а на середні парні відмінності. Ви праві, що рівень підписаного тесту на ранг може бути досить чутливим до асиметрії.
Glen_b -Встановити Моніку

2
На ваш попередній коментар: 1 Симетрія, як правило, не розглядається як частина нуля, але як частина припущень, які вам потрібні для того, щоб перестановки могли бути замінені під нуль. 2. Як вже говорилося раніше, це насправді не тест на медіанів, а на псевдомедіанів, і це справедливо навіть за асиметричної альтернативи. Це правда, що тлумачення іноді простіше, якщо ви робите деякі обмежувальні припущення, але обмеження, необхідні для того, щоб зробити його розумним тестом для медіанів, не повинні бути такими суворими, як припущення про симетричність за альтернативою.
Glen_b -Встановіть Моніку

Відповіді:


3

Розгляньте розподіл парних відмінностей, який дещо важчий, ніж звичайний, але не особливо "піковий"; то часто підписаний тест на ранг буде, як правило, більш потужним, ніж t-тест, але також більш потужним, ніж тестовий знак.

Наприклад, при логістичному розподілі асимптотична відносна ефективність тесту з підписаним рангом відносно t-тесту становить 1,097, тому підписаний тест на ранги повинен бути більш потужним, ніж t (принаймні, у більших зразках), але відносна ефективність асимптотики тестової ознаки відносно t-тесту дорівнює 0,822, тому тестова ознака була б менш потужною, ніж t (знову ж таки, щонайменше, у більших зразках).

Коли ми переходимо до більш важких дистрибутивів (при цьому все-таки уникаючи надмірно пикових), t буде прагнути працювати порівняно гірше, тоді як тест знаків повинен дещо покращитись, і знаковий, і підписаний рейтинг випереджають t при виявленні малих ефекти за значним запасом (тобто знадобиться значно менший розмір вибірки для виявлення ефекту). Буде великий клас розповсюдження, для яких найкращий з трьох є підписаний тест.

т3тδ

графік кривих потужності для t, Вілкоксон підписав тести рангів і знаків з n = 100 і 5% рівнем значущості для t3

Як ми бачимо в сюжеті, підписаний тест на рангову оцінку має більшу потужність, ніж тестовий знак, який, у свою чергу, має більше потужності, ніж t-тест.


Дякую за це @Glen_b! Я все ще намагаюся розібратися, де вона вписується в нашу програму, коли у нас є студенти, для яких навіть поняття влади виходить за рамки їхніх досліджень, і чому ми навчаємо Вілкоксона як основну альтернативу парним т. Але це дає певні корисні мотивації. Дякую!
justme

Між іншим, після розгляду того, яка ознака розподілу впливає на асимптотичну дисперсію медіани (а отже, і на силу знакового тесту), мені стався приклад, коли відносні положення тесту t і знаків зворотні; як результат, я думаю, що існує хороша можливість побудувати випадок, коли підписаний тест може бути значно кращим, ніж будь-який з двох інших тестів. Я пограю з ним ще трохи, коли зможу і, можливо, щось напишу на ньому.
Glen_b -Встановіть Моніку

Що стосується вашої програми, очевидно, що напевно є випадки, коли підписаний ранг перевершує і інші тести (як я окреслив у своїх відповідях - дистрибуції дещо важчіші за звичайні, але не особливо досяжні); t краще в нормі або легше, а тестова ознака краща, коли розподіл має сильний пік (який часто має тенденцію йти разом із дуже важкими хвостами, але не повинен). [Остерігайтеся, однак, плутайте ці ідеї з простими змінами в поширенні, що не змінює їх відносних властивостей.] ... Я впевнений, що ви можете вичавити кілька таких речень у
Glen_b -Встановіть Моніку

Велике спасибі @Glen_b! Біда в тому, що я не викладаю програму, просто підтримую її! Навчальний план у більшості кафедр здається таким: (i) використовувати тест на гіпотезу щодо нормальності (вбий мене зараз) і на основі цього (ii) використовуючи Wilcoxon або t-Test. Тож дрібніші деталі розподілу тощо ніколи навіть не зачіпаються, а також не є владою, лише чи виконуються припущення (злегка сміття). Але ваші думки дуже корисні особисто мені, принаймні!
justme

Чудовий пост @Glen_b! Отже, з точки зору вибору з двох тестів, чи можу я зробити висновок, що ми завжди повинні спочатку обчислити потужність? Замість того, щоб дотримуватися припущення, що завжди використовується тест знаків, якщо розподіл різниці не є нормальним? Дякую!
Лумос
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.