Я трохи ткнувся навколо схрещених архівів і, здається, не знайшов відповіді на моє запитання. Моє запитання таке: Вікіпедія дає три припущення, які потрібно виконати для тестування підписаного Вілкоксоном рангу (трохи змінено для моїх запитань):
Нехай Zi = Xi-Yi для i = 1, ..., n.
Відмінності Zi вважаються незалежними.
(a.) кожен Zi походить з одного і того ж безперервного населення, і (b.) кожен Zi симетричний щодо загальної медіани;
Значення, які представляють Xi та Yi, впорядковані ... тому порівняння "більше ніж", "менше" та "дорівнює" є корисними.
Однак документація на? Wilcox.test в R, схоже, вказує на те, що (2.b) насправді тестується процедурою:
"... якщо і x і y задано, і спарно, це ПРАВИЛЬНО, тест рангового підписаного Вілкоксоном нульового значення має те, що розподіл ... x - y (у парному випадку зразка) симетричний щодо mu."
Мені це звучить так, ніби тест виконується для нульової гіпотези про те, що "Z розподіляється симетрично навколо медіани mu = SomeMu" - таким, що відхилення fo null може бути або відхиленням симетрії, або відхиленням того, що навколо нього Z симетричний є SomeMu.
Це правильне розуміння документації R для wilcox.test? Причина, що важливо, звичайно, полягає в тому, що я провожу ряд парних тестів на різницю на деяких даних перед і після (після "X" і "Y"). Дані "до" і "після" окремо сильно перекошені, але відмінності не нахилені майже настільки ж (хоча все ще дещо перекошені). Маючи на увазі, я маю на увазі, що дані "до" або "після", що розглядаються окремо, мають косисть від 7 до 21 (залежно від вибірки, яку я переглядаю), тоді як дані "відмінності" мають косисть ~ = 0,5 до 5. але майже не так багато.
Якщо наявність косоокості у моїх даних про "відмінності" призведе до того, що тест Вілкоксона дасть мені хибні / упереджені результати (як видається в статті Вікіпедії), то косоокість може викликати велике занепокоєння. Якщо, проте, тести Вілкоксона насправді перевіряють, чи розподіл різниць "симетричний навколо mu = SomeMu" (як, схоже, вказує? Wilcox.test), то це викликає менше занепокоєння.
Таким чином, мої запитання:
Яке вище трактування є правильним? Чи косості в розподілі "відмінності" будуть зміщуватись мій тест Вілкоксона?
Якщо косоокість викликає занепокоєння: "Скільки косоокість викликає занепокоєння?"
Якщо тут підписані Вілкоксоном підрядні тести здаються абсолютно недоречними, якісь пропозиції щодо того, що я повинен використовувати?
Дуже дякую. Якщо у вас є додаткові пропозиції щодо того, як я можу зробити цей аналіз, я більш ніж радий їх почути (хоча я також можу відкрити ще одну нитку для цієї мети). Також це моє перше запитання щодо перехресної перевірки; якщо у вас є пропозиції / коментарі щодо того, як я задав це питання, я також до цього відкритий!
Невелика інформація: я аналізую набір даних, який містить спостереження щодо того, що я називаю "помилками у фірмовому виробництві". У мене є спостереження за помилками, що виникають у виробничому процесі до та після несподіваної перевірки, і однією з цілей аналізу є відповісти на запитання, "чи інспекція впливає на кількість зафіксованих помилок?"
Набір даних виглядає приблизно так:
ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0
Є приблизно 4000 спостережень. Інші змінні - це катагоричні спостереження, що описують характеристики фірм. Розмір може бути невеликим, середнім або великим, і кожна фірма - одна і лише одна з таких. Фірми можуть бути будь-якими або всіма "типами".
Мене попросили провести кілька простих тестів, щоб побачити, чи існували статистично значущі відмінності у спостережуваних показниках помилок до і після перевірок для всіх фірм та різних підгруп (залежно від розміру та типу). Т-тести були випущені, оскільки дані були сильно перекошені як до, так і після, наприклад, в R a раніше дані виглядали приблизно так:
summary(errorsBefore)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# 0.000 0.000 4.000 12.00 13.00 470.0
(Вони складені - я боюся, я не можу розміщувати фактичні дані або будь-які фактичні маніпуляції з ними через власні проблеми / конфіденційність - мої вибачення!)
Парні відмінності були більш централізованими, але все ще не дуже добре вписувались у звичайний розподіл - занадто максимум. Дані про відмінності виглядали приблизно так:
summary(errorsBefore-errorsAfter)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# -110.0 -2.000 0.000 0.005 2.000 140.0
Було запропоновано я використовувати тест з підписанням Вілкоксона і після короткого переконання? Wilcox.test та Wikipedia, і ось, здається, це тест. Зважаючи на припущення, викладені вище, я вважаю, що (1) добре, враховуючи процес генерації даних. Припущення (2.a) не є суто правильним для моїх даних, але обговорення тут: Альтернатива тесту Вілкоксона, коли розподіл не є безперервним? здавалося, вказувало, що це не надто хвилює. Припущення (3) чудово. Моє єдине питання (я вважаю) - це Успіння (2.b).
Ще одна зауваження , через кілька років: я врешті пройшов відмінний непараметричний курс статистики і витратив чимало часу на тести рангової суми. Вбудований у припущення (2.a), "Кожен Zi походить з однієї і тієї ж безперервної сукупності", - це ідея, що обидва зразки грибів походять з популяцій з однаковою дисперсією - це виявляється надзвичайно важливим, практично кажучи. Якщо у вас є проблеми щодо різниці в популяції (з якої ви берете зразки), вам слід потурбуватися про використання WMW.