Нульова гіпотеза Манна-Вітні за неоднакової дисперсії


9

Мені просто цікаво нікчемна гіпотеза тесту Манна-Вітні U. Я часто бачу, що зазначається, що нульовою гіпотезою є те, що дві групи населення мають однаковий розподіл. Але я думаю - якби у мене було дві нормальні популяції з однаковою середньою, але надзвичайно неоднаковою дисперсією, тест Манна-Вітні, певно, не виявив би цієї різниці.

Я також бачив, що це констатувало, що нульова гіпотеза тесту Манна-Вітні є Пр(Х>Y)=0,5або ймовірність спостереження від однієї сукупності ( ) перевищення спостереження від другої сукупності ( Y ) (після виключення зв'язків) дорівнює 0,5. Це, здається, має трохи більше сенсу, але не здається рівнозначним першій нульовій гіпотезі, яку я виклав.ХY

Я сподіваюся трохи допомогти розв’язати це. Дякую!

Відповіді:


5

Тест Манна-Вітні є особливим випадком тесту на перестановку (розподіл під нулем виводиться шляхом перегляду всіх можливих перестановок даних), а тести перестановки мають нуль як однакові розподіли, так що це технічно правильно.

Один із способів мислення статистики тесту Манна-Уітні - це показник кількості разів випадково вибране значення з однієї групи, що перевищує випадково вибране значення з іншої групи. Таким чином, P (X> Y) = 0.5 також має сенс, і це технічно властивість рівних розподілів нульовим (якщо припустити, що безперервні розподіли там, де ймовірність зв’язку дорівнює 0). Якщо два розподіли однакові, то ймовірність того, що X більше Y, дорівнює 0,5, оскільки вони обидва отримані з одного і того ж розподілу.

Зазначений випадок 2 розподілів, що мають однакову середню, але широко відрізняються дисперсії, відповідає 2-й нульовій гіпотезі, але не 1-й із однакових розподілів. Ми можемо зробити деяке моделювання, щоб побачити, що відбувається з значеннями р у цьому випадку (теоретично вони повинні бути рівномірно розподілені):

> out <- replicate( 100000, wilcox.test( rnorm(25, 0, 2), rnorm(25,0,10) )$p.value )
> hist(out)
> mean(out < 0.05)
[1] 0.07991
> prop.test( sum(out<0.05), length(out), p=0.05 )

        1-sample proportions test with continuity correction

data:  sum(out < 0.05) out of length(out), null probability 0.05
X-squared = 1882.756, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.05
95 percent confidence interval:
 0.07824054 0.08161183
sample estimates:
      p 
0.07991 

Так чітко це відкидається частіше, ніж слід, і нульова гіпотеза помилкова (це відповідає рівності розподілів, але не задачі = 0,5).

Мислення з точки зору ймовірності X> Y також стикається з деякими цікавими проблемами, якщо ви коли-небудь порівнюєте групи, засновані на кубиках Ефрона .


Привіт Грег, дякую за відповідь. Це звучить так, як ви говорите: я знайшов дещо особливого випадку, коли тест не працює належним чином при рівних розподілах нульовим. І, крім того, недійсні гіпотези, які я висловив, не рівні. Це правильно?
Jimj

4

Ман-Вітні не чутливий до змін дисперсії з рівними середніми, але може - як ви бачите з формою , виявити різниці, які призводять до відхилення від (наприклад, де і середнє значення, і дисперсія зростають разом) Досить чітко, якщо у вас було дві нормалі з рівним середнім, їх різниці симетричні приблизно до нуля. Тому , що є нульовою ситуацією.П(Х>Y)=0,5П(Х>Y)0,5П(Х>Y)=П(Х-Y>0)=12

Наприклад, якщо у вас розподіл є експоненціальним із середнім тоді як має експоненціальний розподіл із середнімY1Хк (зміна масштабу), Ман-Вітні чутливий до цього (справді, беручи журнали обох сторін, це просто розташування-зсув, і на Манна-Вітні не впливає монотонна трансформація).

-

Якщо вас цікавлять тести, які концептуально дуже схожі на Манна-Вітні, які чутливі до відмінностей у поширенні за рівності медіанів, є кілька таких тестів.

Там Зігель-Тукей тест і тест Ансарі-Бредлі, наприклад, як тісно пов'язані з тест Манна-Уїтні-Вілкоксона два зразка.

Вони обидва базуються на основній ідеї ранжування з кінця.

Якщо ви використовуєте R, тест Ансарі-Бредлі вбудований у ... ?ansari.test

Фактично, Зігель-Тукі просто робить тест Манна-Вітні-Вілкоксона на ранги, обчислені з вибірки по-різному; якщо ви самі класифікуєте дані, вам не потрібна окрема функція для p-значень. Тим не менш, ви можете знайти деякі, як тут:

http://www.r-statistics.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-variability-r-code/

-

(стосовно коментаря ttnphns під моєю оригінальною відповіддю)

Ви б надмірно інтерпретували мою відповідь, щоб прочитати її як незгодну з @GregSnow у будь-якому особливо суттєвому сенсі. Звичайно, різниця в акцентах і певній мірі в тому, про що ми говоримо, але я був би дуже здивований, якщо за цим стоїть багато справжньої незгоди.

Процитуємо Менна та Вітні: "Для тестування гіпотези пропонується статистика залежно від відносних рангів 's та ' s .Uхуf=г Це однозначно; він повністю підтримує позицію @ GregSnow.

Тепер давайте подивимося , як будуються статистик: « Нехай порахувати кількість разів передує .Uух » Тепер , якщо їх нуль вірний, то ймовірність того , що події ... але Є й інші способи отримати вірогідність 0,5, і в цьому сенсі можна зрозуміти, що тест може працювати в інших обставинах. Наскільки вони оцінюють (переосмислену) ймовірність > , це підтримує те, що я сказав.12YХ

Однак, щоб рівні значущості гарантувалися точно правильними, вам знадобиться розподіл який відповідає нульовому розподілу. Це випливає з припущення, що всі перестановки міток групи і для об'єднаних спостережень під нулем були однаково вірогідними. Це, безумовно, має місце при . Точно так, як сказав @GregSnow.UХYf=г

Питання полягає в тому, наскільки це так (тобто, що розподіл тестової статистики відповідає тому, який отриманий за умови, що , або приблизно так), для більш загально вираженої нулі.f=г

Я вважаю, що у багатьох ситуаціях це відбувається; зокрема для ситуацій, що включають, але більш загальні, ніж описані вами (дві нормальні популяції з однаковим середнім, але вкрай неоднаковою дисперсією можна досить узагальнити, не змінюючи отриманий розподіл на основі рангів), я вважаю, що розподіл тестової статистики виявляється, має той самий розподіл, за яким він був отриманий, і тому він повинен бути дійсним там. Я зробив деякі симуляції, які, здається, це підтримують. Однак це не завжди буде дуже корисним тестом (він може мати слабку потужність).

Я не пропоную жодних доказів того, що це так. Я застосував певний аргумент з інтуїцією / хвилею, а також зробив основні імітації, які дозволяють припустити, що це правда - що Ман-Уітні працює (в тому, що має правильний розподіл під нулем) набагато ширше, ніж коли .f=г

Зробіть з цього, що ви хочете, але я не розумію це як суттєву незгоду з @GregSnow

Довідка - оригінальний папір Манна та Вітні


Хіба я вам прямо , що ви згодні з цим словами з сторінки Вікіпедії розмови Манна-Уїтні: the null hypothesis of Mann-Whitney U-test is not about the equality of distributions. Is is about the symmetry between two populations with respect to the probability of obtaining a larger observation. І ви не згодні з відповіддю @ Грега, правда?
ttnphns

Я додав дещо обговорення в редагуванні.
Glen_b -Встановити Моніку

Дуже приємне доповнення. Я буду його вивчати (я завжди відчував, що ніби в тесті на МВт є нюанси, які мене продовжують уникати). Тим часом, чи погоджуєтесь ви, якщо я скажу: "Оскільки статистика тесту на МВт відображає лише (не) рівність середніх рангів , можуть бути ситуації, коли f ~ = g [я розумію f, g як оригінальні розподіли, попередній рейтинг], але тест є безвідмовним повністю актуальним, оскільки він продовжує мати справу з тим же H0, що і за f = g. Прикладом такої ситуації є симетричні розподіли, повністю ідентичні, за винятком параметра розкиду (дисперсії) ".
ttnphns

У позначенні (до речі, Манна та Вітні), f і г - густини Х і Y. Я погоджуюся з тим, що, наскільки я перевірив / зрозумів обставини, ваша заява, мабуть, є такою. Я підозрюю, що в Mann-Whitney все ще багато, що також ухиляється від мене.
Glen_b -Встановити Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.