Доречність Уілкоксона підписав тест на рангову оцінку


11

Я трохи ткнувся навколо схрещених архівів і, здається, не знайшов відповіді на моє запитання. Моє запитання таке: Вікіпедія дає три припущення, які потрібно виконати для тестування підписаного Вілкоксоном рангу (трохи змінено для моїх запитань):

Нехай Zi = Xi-Yi для i = 1, ..., n.

  1. Відмінності Zi вважаються незалежними.

  2. (a.) кожен Zi походить з одного і того ж безперервного населення, і (b.) кожен Zi симетричний щодо загальної медіани;

  3. Значення, які представляють Xi та Yi, впорядковані ... тому порівняння "більше ніж", "менше" та "дорівнює" є корисними.

Однак документація на? Wilcox.test в R, схоже, вказує на те, що (2.b) насправді тестується процедурою:

"... якщо і x і y задано, і спарно, це ПРАВИЛЬНО, тест рангового підписаного Вілкоксоном нульового значення має те, що розподіл ... x - y (у парному випадку зразка) симетричний щодо mu."

Мені це звучить так, ніби тест виконується для нульової гіпотези про те, що "Z розподіляється симетрично навколо медіани mu = SomeMu" - таким, що відхилення fo null може бути або відхиленням симетрії, або відхиленням того, що навколо нього Z симетричний є SomeMu.

Це правильне розуміння документації R для wilcox.test? Причина, що важливо, звичайно, полягає в тому, що я провожу ряд парних тестів на різницю на деяких даних перед і після (після "X" і "Y"). Дані "до" і "після" окремо сильно перекошені, але відмінності не нахилені майже настільки ж (хоча все ще дещо перекошені). Маючи на увазі, я маю на увазі, що дані "до" або "після", що розглядаються окремо, мають косисть від 7 до 21 (залежно від вибірки, яку я переглядаю), тоді як дані "відмінності" мають косисть ~ = 0,5 до 5. але майже не так багато.

Якщо наявність косоокості у моїх даних про "відмінності" призведе до того, що тест Вілкоксона дасть мені хибні / упереджені результати (як видається в статті Вікіпедії), то косоокість може викликати велике занепокоєння. Якщо, проте, тести Вілкоксона насправді перевіряють, чи розподіл різниць "симетричний навколо mu = SomeMu" (як, схоже, вказує? Wilcox.test), то це викликає менше занепокоєння.

Таким чином, мої запитання:

  1. Яке вище трактування є правильним? Чи косості в розподілі "відмінності" будуть зміщуватись мій тест Вілкоксона?

  2. Якщо косоокість викликає занепокоєння: "Скільки косоокість викликає занепокоєння?"

  3. Якщо тут підписані Вілкоксоном підрядні тести здаються абсолютно недоречними, якісь пропозиції щодо того, що я повинен використовувати?

Дуже дякую. Якщо у вас є додаткові пропозиції щодо того, як я можу зробити цей аналіз, я більш ніж радий їх почути (хоча я також можу відкрити ще одну нитку для цієї мети). Також це моє перше запитання щодо перехресної перевірки; якщо у вас є пропозиції / коментарі щодо того, як я задав це питання, я також до цього відкритий!


Невелика інформація: я аналізую набір даних, який містить спостереження щодо того, що я називаю "помилками у фірмовому виробництві". У мене є спостереження за помилками, що виникають у виробничому процесі до та після несподіваної перевірки, і однією з цілей аналізу є відповісти на запитання, "чи інспекція впливає на кількість зафіксованих помилок?"

Набір даних виглядає приблизно так:

ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0 
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0

Є приблизно 4000 спостережень. Інші змінні - це катагоричні спостереження, що описують характеристики фірм. Розмір може бути невеликим, середнім або великим, і кожна фірма - одна і лише одна з таких. Фірми можуть бути будь-якими або всіма "типами".

Мене попросили провести кілька простих тестів, щоб побачити, чи існували статистично значущі відмінності у спостережуваних показниках помилок до і після перевірок для всіх фірм та різних підгруп (залежно від розміру та типу). Т-тести були випущені, оскільки дані були сильно перекошені як до, так і після, наприклад, в R a раніше дані виглядали приблизно так:

summary(errorsBefore)
# Min.  1st Qu.  Median   Mean  3rd Qu.    Max
# 0.000  0.000    4.000  12.00    13.00  470.0

(Вони складені - я боюся, я не можу розміщувати фактичні дані або будь-які фактичні маніпуляції з ними через власні проблеми / конфіденційність - мої вибачення!)

Парні відмінності були більш централізованими, але все ще не дуже добре вписувались у звичайний розподіл - занадто максимум. Дані про відмінності виглядали приблизно так:

summary(errorsBefore-errorsAfter)
# Min.   1st Qu.  Median   Mean  3rd Qu.    Max
# -110.0  -2.000   0.000  0.005   2.000   140.0

Було запропоновано я використовувати тест з підписанням Вілкоксона і після короткого переконання? Wilcox.test та Wikipedia, і ось, здається, це тест. Зважаючи на припущення, викладені вище, я вважаю, що (1) добре, враховуючи процес генерації даних. Припущення (2.a) не є суто правильним для моїх даних, але обговорення тут: Альтернатива тесту Вілкоксона, коли розподіл не є безперервним? здавалося, вказувало, що це не надто хвилює. Припущення (3) чудово. Моє єдине питання (я вважаю) - це Успіння (2.b).

Ще одна зауваження , через кілька років: я врешті пройшов відмінний непараметричний курс статистики і витратив чимало часу на тести рангової суми. Вбудований у припущення (2.a), "Кожен Zi походить з однієї і тієї ж безперервної сукупності", - це ідея, що обидва зразки грибів походять з популяцій з однаковою дисперсією - це виявляється надзвичайно важливим, практично кажучи. Якщо у вас є проблеми щодо різниці в популяції (з якої ви берете зразки), вам слід потурбуватися про використання WMW.


Дякую за дві відповіді! Вони обоє досить рівномірно мені допомогли. Я б "обрав обох", якби міг. Майк вказав мені на деяке теоретичне розуміння, яке було дуже корисно з концептуальної точки зору, хоча Аніко трохи більше прямо відповідав на моє початкове запитання. Дякую обом!
CompEcon

Відповіді:


8

Вікіпедія ввела вас в оману, заявивши, "... якщо і x, і y дано, і в парі є ПРАВИЛЬНИМ, Вілкоксон підписав ранговий тест з нуля, що розподіл ... з x - y (у парі зразка двох пар) симетричний про му виконується ».

zi=хi-уi

ln(хi)ln(уi)

Я? Я б робив і те, і інше, що я міг би приготувати (тест на коефіцієнт ймовірності на рахунку Пуассона за твердими розмірами?). Тестування гіпотез - це те, щоб визначити, чи докази переконливі, а деякі люди приймають купу переконливих дій.


Ах, це має багато сенсу. Особливо зараз, коли я повернувся додому і витягнув свій старий підручник з DeGroot & Schervish, в якому є хороший опис того, що насправді роблять ці знакові випробування. Фантастичний. І дякую за загальні думки щодо тестування гіпотез :) Мені подобається перспектива. Одне незначне зауваження: частина, яку ви відзначаєте як оманливу, насправді з R, з документації на wilcox.test. Це мене трохи заважає ...
CompEcon

9

І Вікіпедія, і довідкова сторінка R начебто коректні і намагаються констатувати одне і те ж, вони просто по-різному формулюють це.

У статті Вікіпедії зазначено гіпотези як (медіана = 0) проти (медіана! = 0), і сказано, що ви можете зробити це з тесту, якщо відмінності мають симетричний розподіл (+ інші припущення).

Сторінка довідки R більш конкретна, вона констатує гіпотези як (медіана = 0, а відмінності мають симетричний розподіл) проти (принаймні одна з них помилкова). Тож воно перенесло припущення в нульову гіпотезу. Я думаю, що вони зробили це для того, щоб підкреслити необхідність симетричності: при перекосах різниць тест підписаного рангу відкине нульову гіпотезу, навіть якщо медіана померла. Якщо ви читаєте підручник, це також може сказати вам, що нульова гіпотеза, що перевіряється, P (X> Y) = 0,5 - решта насправді випливає з цього.

Що стосується застосування, питання, звичайно, полягає в тому, чи дбаєш ви конкретно про медіану (і тоді перекос - це проблема, і медіана тест - можлива альтернатива), чи ви дбаєте про весь розподіл, а потім P (X> у)! = 0,5 - свідчення змін.


1
Гаразд, це має сенс. Дякую за вклад! Я зауважую, що на сторінці Вікіпедії для медіанного тесту йдеться про те, що кращий тест Манна-Вітні-У є кращим. Це одразу змушує мене думати, що я свого роду повернувся з того місця, з якого я почав, думаючи, що парний тест Вілкоксона якось використовує більше інформації. Можливо, те, що я насправді намагаюся продумати, - це те, що ти маєш на увазі, коли ти кажеш, що «дбаєш конкретно про медіану ... або про весь розподіл». Я дбаю про весь розподіл, але характеризую його через медіану ..
CompEcon
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.