Оскільки дискусія тривала довго, я взяв свої відповіді на відповідь. Але я змінив порядок.
Перестановочні тести є "точнішими", а не асимптотичними (порівняйте, наприклад, з тестами співвідношення ймовірності). Так, наприклад, ви можете зробити перевірку засобів навіть без можливості обчислити розподіл різниці в засобах під нулем; вам навіть не потрібно вказувати пов'язані дистрибуції. Ви можете розробити тестову статистику, яка має гарну потужність за набором припущень, не будучи настільки чутливими до них, як повністю параметричне припущення (ви можете використовувати статистику, яка є надійною, але має хороший ARE).
Зауважте, що визначення, яке ви даєте (точніше, той, кого ви там цитуєте, дає) не є універсальними; деякі люди називають U статистикою тесту перестановки (те, що робить тест на перестановку - це не статистика, а те, як ви оцінюєте p-значення). Але після того, як ви робите тест на перестановку, і ви призначили напрямок, оскільки «крайності цього не відповідають H0», таке визначення для T вище - це, як ви працюєте з p-значеннями - це лише фактична частка розподіл перестановки принаймні настільки ж екстремальний, як вибірка під нулем (саме визначення р-значення).
Так, наприклад, якщо я хочу зробити (односкладний, для простоти) тест таких засобів, як двопробний t-тест, я міг би зробити свою статистику чисельником t-статистики або самою t-статистикою, або сума першого зразка (кожне з цих визначень є монотонним в інших, що залежить від комбінованого зразка), або будь-яке монотонне перетворення їх і мають однаковий тест, оскільки вони дають однакові p-значення. Все, що мені потрібно зробити, - це побачити, наскільки далеко (в пропорційному співвідношенні) розподіл перестановки будь-якої статистики я вибираю вибіркової статистичної брехні. T, як визначено вище, - це лише інша статистика, така ж хороша, як і будь-яка інша, яку я міг би вибрати (T, як визначено, є одноманітною в U).
T не буде абсолютно рівномірним, тому що це вимагатиме постійного розподілу, і T обов'язково дискретно. Оскільки U і, отже, T можуть відображати більше однієї перестановки на дану статистику, результати не є вірогідними, але вони мають "cdf-подібний" cdf **, але такий, де кроки не обов'язково рівні за розміром .
** (F(x)≤x, і суворо дорівнює їй у правій межі кожного стрибка - напевно, є назва того, що це насправді)
Для розумної статистики як n іде до нескінченності розподілу Tпідходи до рівномірності. Я думаю, що найкращий спосіб почати їх розуміти - це насправді робити їх у різних ситуаціях.
Чи повинен T (X) дорівнювати p-значенню на основі U (X) для будь-якого зразка X? Якщо я правильно розумію, я знайшов це на сторінці 5 цього слайда.
T - р-значення (для випадків, коли велике U вказує на відхилення від нуля, а мале U відповідає йому). Зауважте, що розподіл є умовним для вибірки. Таким чином, його розподіл не "для будь-якого зразка".
Отже, користь використання тесту перестановки полягає в обчисленні p-значення вихідної статистики тесту U, не знаючи розподілу X під нуль? Тому розподіл T (X) може бути не обов'язково рівномірним?
Я вже пояснював, що Т не рівномірна.
Я думаю, я вже пояснив те, що бачу як переваги тестів на перестановку; інші люди запропонують інші переваги ( наприклад ).
Чи означає "T значення p (для випадків, коли велике U вказує на відхилення від нуля, а мале U відповідає йому)", означає, що значення р для тестової статистики U та вибірки X є T (X)? Чому? Чи є посилання на пояснення цього?
У реченні, яке ви цитували, прямо вказано, що Т - значення р, і коли воно є. Якщо ви можете пояснити, що в цьому незрозуміло, можливо, я міг би сказати більше. Щодо того, дивіться визначення р-значення (перше речення за посиланням) - воно цілком прямо випливає з цього
Там гарне елементарне обговорення перестановок тестів тут .
-
Редагувати: я додаю сюди невеликий приклад тесту перестановки; цей (R) код підходить лише для невеликих вибірок - вам потрібні кращі алгоритми для знаходження крайніх комбінацій у помірних вибірках.
Розглянемо тест на перестановку проти однохвостої альтернативи:
H0:μx=μу (деякі люди наполягають на цьому мкх≥мку*)
Н1:мкх<мку
* але я цього зазвичай уникаю, оскільки він особливо схильний плутати проблему для студентів при спробі опрацювати нульові розподіли
за такими даними:
> x;y
[1] 25.17 20.57 19.03
[1] 25.88 25.20 23.75 26.99
Існує 35 способів поділу 7 спостережень на вибірки розміром 3 і 4:
> choose(7,3)
[1] 35
Як було сказано раніше, зважаючи на 7 значень даних, сума першого зразка є монотонною у різниці в засобах, тому давайте використовувати це як тестову статистику. Таким чином, оригінальний зразок має тестову статистику:
> sum(x)
[1] 64.77
Тепер ось перестановка перестановки:
> sort(apply(combn(c(x,y),3),2,sum))
[1] 63.35 64.77 64.80 65.48 66.59 67.95 67.98 68.66 69.40 69.49 69.52 69.77
[13] 70.08 70.11 70.20 70.94 71.19 71.22 71.31 71.62 71.65 71.90 72.73 72.76
[25] 73.44 74.12 74.80 74.83 75.91 75.94 76.25 76.62 77.36 78.04 78.07
(Не важливо сортувати їх, я просто зробив це, щоб полегшити бачення тестової статистики - це друге значення з кінця.)
Ми можемо побачити (в даному випадку шляхом перевірки), що p становить 2/35, або
> 2/35
[1] 0.05714286
(Зверніть увагу, що лише у випадку відсутності перекриття xy тут можливе значення р нижче .05. У цьому випадку T було б дискретно рівномірним, оскільки в них немає прив'язаних значень U.)
Рожеві стрілки вказують статистичну вибірку на осі x, а p-значення на осі y.