Яка користь від використання перестановочних тестів?

Під час тестування деяких нульових проти альтернативних гіпотез за допомогою тестової статистики , де , застосуємо перестановочний тест із набором перестановок на і у нас є нова статистика $U(X)$ $X = \{ x_i, ..., x_n\}$ $G$ $X$

Т (Х) : = \frac{# {π \in Г : U (π Х) \geq U (Х)}}{| Г |} .

$T(X) := \frac{\# \{\pi \in G: U(\pi X) \geq U(X)\}}{|G|}.$

Яка перевага використання тесту перестановки, ніж його використання? Тобто, що це таке, коли працює тест на перестановку?
Які умови, щоб це сталося? Такі як деякі умови тестової статистики та / або нульова гіпотеза? $U$

Наприклад,

Чи повинен дорівнювати p-значенню на основі для зразка ? Якщо так, то чому? (посилання також оцінені) $T(X)$ $U(X)$ $X$

Значення p визначається як . Якщо тест перестановки призначений для оцінки розподілу перестановки , як дорівнює р-значення при ? Тим більше, що в нульовому може бути більше одного розподілу , і не враховує нульові розподіли по одному, а потім приймає і . $U(X)$
$inf_{c \in R : U (x) \geq c} sup_{F \in H} P (U (X) \geq c | X \sim F)$ $\inf_{c \in \mathbb R: U(x) \geq c} \sup_{F \in H} P(U(X) \geq c | X \sim F)$ $U(X) | X=x$ $T(X)$ $U(X)$ $X=x$ $H$ $T(X)$ $\sup_{F\in H}$ $\inf_{c: U(x) \geq c}$
Чи повинен тест на перестановку робити $T(X)$ розподілом без нульових гіпотез? За яких умов це станеться?
Чи повинен $T(X)$ рівномірно розподілятися по $[0,1]$ ? За яких умов це станеться? Зауважте, що коли $U(\cdot)$ є постійною функцією, $T(\cdot)$ також є постійним при $1$ і розподіл $T(X)$ далеко не є рівномірним за $[0,1]$ .

Дякую та з повагою!

— Тім
джерело

@Glen_b: Дякую! Чи повинен дорівнювати p-значенню на основі для будь-якого зразка ? Якщо я правильно розумію, я виявив це на сторінці 5 цього слайда. Отже, користь використання тесту перестановки полягає в обчисленні p-значення вихідної тестової статистики не знаючи розподілу під нулем? Тому розподіл може бути не обов'язково рівномірним?

T (X)

$T(X)$

U (X)

$U(X)$

X

$X$

U

$U$

X

$X$

T (X)

$T(X)$

— Тім

Чи означає "T значення p (для випадків, коли велике U вказує на відхилення від нуля, а мале U відповідає йому)", означає, що значення р для тестової статистики та вибірки є ?

U

$U$

X

$X$

T (X)

$T(X)$

— Тім

Чому? Чи є посилання на пояснення цього?

— Тім

Оскільки дискусія тривала довго, я взяв свої відповіді на відповідь. Але я змінив порядок.

Перестановочні тести є "точнішими", а не асимптотичними (порівняйте, наприклад, з тестами співвідношення ймовірності). Так, наприклад, ви можете зробити перевірку засобів навіть без можливості обчислити розподіл різниці в засобах під нулем; вам навіть не потрібно вказувати пов'язані дистрибуції. Ви можете розробити тестову статистику, яка має гарну потужність за набором припущень, не будучи настільки чутливими до них, як повністю параметричне припущення (ви можете використовувати статистику, яка є надійною, але має хороший ARE).

Зауважте, що визначення, яке ви даєте (точніше, той, кого ви там цитуєте, дає) не є універсальними; деякі люди називають U статистикою тесту перестановки (те, що робить тест на перестановку - це не статистика, а те, як ви оцінюєте p-значення). Але після того, як ви робите тест на перестановку, і ви призначили напрямок, оскільки «крайності цього не відповідають H0», таке визначення для T вище - це, як ви працюєте з p-значеннями - це лише фактична частка розподіл перестановки принаймні настільки ж екстремальний, як вибірка під нулем (саме визначення р-значення).

Так, наприклад, якщо я хочу зробити (односкладний, для простоти) тест таких засобів, як двопробний t-тест, я міг би зробити свою статистику чисельником t-статистики або самою t-статистикою, або сума першого зразка (кожне з цих визначень є монотонним в інших, що залежить від комбінованого зразка), або будь-яке монотонне перетворення їх і мають однаковий тест, оскільки вони дають однакові p-значення. Все, що мені потрібно зробити, - це побачити, наскільки далеко (в пропорційному співвідношенні) розподіл перестановки будь-якої статистики я вибираю вибіркової статистичної брехні. T, як визначено вище, - це лише інша статистика, така ж хороша, як і будь-яка інша, яку я міг би вибрати (T, як визначено, є одноманітною в U).

T не буде абсолютно рівномірним, тому що це вимагатиме постійного розподілу, і T обов'язково дискретно. Оскільки U і, отже, T можуть відображати більше однієї перестановки на дану статистику, результати не є вірогідними, але вони мають "cdf-подібний" cdf **, але такий, де кроки не обов'язково рівні за розміром .

** ( $F(x)\leq x$ , і суворо дорівнює їй у правій межі кожного стрибка - напевно, є назва того, що це насправді)

Для розумної статистики як $n$ іде до нескінченності розподілу $T$ підходи до рівномірності. Я думаю, що найкращий спосіб почати їх розуміти - це насправді робити їх у різних ситуаціях.

Чи повинен T (X) дорівнювати p-значенню на основі U (X) для будь-якого зразка X? Якщо я правильно розумію, я знайшов це на сторінці 5 цього слайда.

T - р-значення (для випадків, коли велике U вказує на відхилення від нуля, а мале U відповідає йому). Зауважте, що розподіл є умовним для вибірки. Таким чином, його розподіл не "для будь-якого зразка".

Отже, користь використання тесту перестановки полягає в обчисленні p-значення вихідної статистики тесту U, не знаючи розподілу X під нуль? Тому розподіл T (X) може бути не обов'язково рівномірним?

Я вже пояснював, що Т не рівномірна.

Я думаю, я вже пояснив те, що бачу як переваги тестів на перестановку; інші люди запропонують інші переваги ( наприклад ).

Чи означає "T значення p (для випадків, коли велике U вказує на відхилення від нуля, а мале U відповідає йому)", означає, що значення р для тестової статистики U та вибірки X є T (X)? Чому? Чи є посилання на пояснення цього?

У реченні, яке ви цитували, прямо вказано, що Т - значення р, і коли воно є. Якщо ви можете пояснити, що в цьому незрозуміло, можливо, я міг би сказати більше. Щодо того, дивіться визначення р-значення (перше речення за посиланням) - воно цілком прямо випливає з цього

Там гарне елементарне обговорення перестановок тестів тут .

Редагувати: я додаю сюди невеликий приклад тесту перестановки; цей (R) код підходить лише для невеликих вибірок - вам потрібні кращі алгоритми для знаходження крайніх комбінацій у помірних вибірках.

Розглянемо тест на перестановку проти однохвостої альтернативи:

$H_0: \mu_x = \mu_y$ (деякі люди наполягають на цьому $\mu_x \geq \mu_y$ *)
$H_1: \mu_x < \mu_y$

* але я цього зазвичай уникаю, оскільки він особливо схильний плутати проблему для студентів при спробі опрацювати нульові розподіли

за такими даними:

> x;y
[1] 25.17 20.57 19.03
[1] 25.88 25.20 23.75 26.99

Існує 35 способів поділу 7 спостережень на вибірки розміром 3 і 4:

> choose(7,3)
[1] 35

Як було сказано раніше, зважаючи на 7 значень даних, сума першого зразка є монотонною у різниці в засобах, тому давайте використовувати це як тестову статистику. Таким чином, оригінальний зразок має тестову статистику:

> sum(x)
[1] 64.77

Тепер ось перестановка перестановки:

> sort(apply(combn(c(x,y),3),2,sum))
 [1] 63.35 64.77 64.80 65.48 66.59 67.95 67.98 68.66 69.40 69.49 69.52 69.77
[13] 70.08 70.11 70.20 70.94 71.19 71.22 71.31 71.62 71.65 71.90 72.73 72.76
[25] 73.44 74.12 74.80 74.83 75.91 75.94 76.25 76.62 77.36 78.04 78.07

(Не важливо сортувати їх, я просто зробив це, щоб полегшити бачення тестової статистики - це друге значення з кінця.)

Ми можемо побачити (в даному випадку шляхом перевірки), що $p$ становить 2/35, або

> 2/35
[1] 0.05714286

(Зверніть увагу, що лише у випадку відсутності перекриття xy тут можливе значення р нижче .05. У цьому випадку $T$ було б дискретно рівномірним, оскільки в них немає прив'язаних значень $U$ .)

розподіл перестановки

Рожеві стрілки вказують статистичну вибірку на осі x, а p-значення на осі y.

— Glen_b -Встановити Моніку
джерело

Дякую! Отже, по суті, перестановочний тест використовується для оцінки розподілу

U (X)

$U(X)$ під нульовим розподілом

X

$X$ чи не так? Тому

T (X)

$T(X)$ залежить від нульового розподілу

X

$X$ , але р-значення є інф-швидкістю FP для всіх нульових розподілів

X

$X$ , і

T (X)

$T(X)$ - р-значення для

U

$U$ і

X

$X$ ?

— Тім

Він оцінює перестановку перестановки

U (X) | X = x

$U(X)|X=x$ . Це той факт, що ви ставитесь до всіх перестановок як однаково вірогідних, що робить це "під нуль" (оскільки під нулем перестановки повинні бути однаково вірогідними).

— Glen_b -Встановити Моніку

(1) Р-значення

U (X)

$U(X)$ визначається як

inf_{c \in R : U (x) \geq c} sup_{F \in H} P (U (X) \geq c | X \sim F)

$\inf_{c \in \mathbb R: U(x) \geq c} \sup_{F \in H} P(U(X) \geq c | X \sim F)$ . Якщо тест перестановки призначений для оцінки розподілу перестановки

U (X) | X = x

$U(X) | X=x$ , як

T (X)

$T(X)$ дорівнює p-значення

U (X)

$U(X)$ у

X = x

$X=x$ ? Тим більше, що в нулі може бути більше одного розподілу

H

$H$ , і

T (X)

$T(X)$ не враховує нульові розподіли по одному, а потім приймає

sup_{F \in H}

$\sup_{F\in H}$ і

inf_{c : U (x) \geq c}

$\inf_{c: U(x) \geq c}$ . (2) Так

T (X)

$T(X)$ мають однаковий розподіл для всіх нульових розподілів, тобто без розподілу wrt нуль?

— Тім

Додано до (1), тест перестановки застосовується не лише до простих нулів, але і до складених нулів, чи не так?

— Тім

(1) Визначено де? Це здається дивним визначенням. Чому б ви вказали розподіл X? Ви кондиціонуєтесь

X = x

$X=x$ . Здається, ваша плутанина випливає з цього досить дивного визначення. (2) для мене взагалі не має сенсу.

— Glen_b -Встановити Моніку