Чому порівняно з асимптотичною відносною ефективністю тесту Вілкоксона порівняно з t-тестом Стьюдента для нормально розподілених даних?


13

Добре відомо, що відносна асимптотична ефективність (ARE) тесту з рангом підписаного Вілкоксоном є порівняно з t- тестом Стьюдента , якщо дані отримані з нормально розподіленої сукупності. Це справедливо як для базового тесту на один зразок, так і для варіанта для двох незалежних зразків (Wilcoxon-Mann-Whitney U). Це також мають тест Круськала-Уолліса по порівнянні з ANOVA F -тест, для нормальних даних.3π0.955

Чи має цей чудовий (для мене один із " найнесподіваніших проявівπ ") та надзвичайно простий результат проникливий, чудовий чи простий доказ?


З огляду на появу в нормальному СГО, поява в ARE не повинно бути дійсно все , що дивно. Я загрожую відповіддю, але пройде певний час, щоб зробити хороший. πππ
Glen_b -Встановіть Моніку

1
@Glen_b Дійсно - я вже бачив дискусію "чому з'являється так багато в статистиці" (хоча я не можу пригадати, було це в CV чи ні) і "через нормальний розподіл" я знаю, що урожай багато , але все ще приємно дивує перший раз, коли ви його бачите. Для порівняння ARE Манна-Вітні проти двопробного t-тесту - 3 за експоненціальними даними, 1,5 - для подвійного експоненціалу та 1 - для рівномірного - набагато кругліше! 3 / ππ3/π
Срібляста рибка

1
@Silverfish Я пов’язав сторінку 197 Ван дер Ваарта "Асимптотична статистика". Для одного зразка тестові знаки мають ARE щодо t-тесту. 2/π
Хашаа

1
@Silverfish ... і при логістиці це . Існує досить багато відомих ARE (в одному або двох вибіркових випадках), що включають і досить багато, які є простими співвідношеннями цілих чисел. π(π/3)2π
Glen_b -Встановіть Моніку

1
Для одного зразка, підписаного ранговим тестом, здається, що це . Для одного зразка тестового знаку це . Отже, ми уточнили свою позицію. Я думаю, що це хороший знак. 2 / π3/π2/π
Хашаа

Відповіді:


10

Короткий ескіз ARE для одноразового -test, підписаного тесту та тесту підписаного рангуt

Я очікую, що довга версія відповіді @ Glen_b включає детальний аналіз двоспробового підписаного рангового тесту разом з інтуїтивним поясненням ARE. Тож я пропущу більшу частину виведення. (У випадку з одним зразком ви можете знайти відсутні деталі в Lehmann TSH).

Проблема тестування : Нехай - випадкова вибірка з моделі розташування , симетрична приблизно нулю. Ми повинні обчислити ARE підписаного тесту, підписаного тесту з рангом для гіпотези щодо t-тесту. f ( x - θ ) H 0 : θ = 0X1,,Xnf(xθ)H0:θ=0

Для оцінки відносної ефективності тестів розглядаються лише локальні альтернативи, оскільки послідовні випробування мають потужність, що має тенденцію до 1 проти нерухомої альтернативи. Локальні альтернативи, що породжують нетривіальну асимптотичну силу, часто мають форму для фіксованого , що в деякій літературі називається дрейфом Пітмена . годθn=h/nh

Попереду наше завдання

  • знайти граничне розподіл кожної статистики тесту під нулем
  • знайти граничне розподіл кожної статистики тесту під альтернативу
  • обчислити локальну асимптотичну силу кожного тесту

Тест на статику та асимптотику

  1. t-тест (з огляду на існування ) t n = σ
    tn=nX¯σ^dN(0,1)under the null
    tn=nX¯σ^dN(h/σ,1)under the alternative θ=h/n
    • тому тест, який відхиляє, якщо має функцію асимптотичного живлення 1 - Φ ( z α - h 1tn>zα
      1Φ(zαh1σ)
  2. підписаний тест і має локальну асимптотичну потужність Sn=1ni=1n1{Xi>0}
    n(Sn12)dN(0,14)under the null 
    1 - Φ ( z α - 2 h f ( 0 ) )
    n(Sn12)dN(hf(0),14)under the alternative 
    1Φ(zα2hf(0))
  3. тест підписаного рейтингу і має локальну асимптотичну потужність
    Wn=n2/3i=1nRi1{Xi>0}dN(0,13)under the null 
    WndN(2hf2,13)under the alternative 
    1Φ(zα12hf2)

Тому Якщо стандартна нормальна щільність, ,

ARE(Sn)=(2f(0)σ)2
ARE(Wn)=(12f2σ)2
fARE(Sn)=2/πARE(Wn)=3/π

Якщо є рівномірним на [-1,1], ,fARE(Sn)=1/3ARE(Wn)=1/3

Зауваження щодо виведення розподілу за альтернативою

Звичайно, існує багато способів вивести обмежувальний розподіл під альтернативу. Одним із загальних підходів є використання третьої леми Le Cam. У спрощеній версії зазначено

Нехай - журнал коефіцієнта ймовірності. Для деякої статистики , якщо під нулем, тодіΔnWn

(Wn,Δn)dN[(μσ2/2),(σW2ττσ2/2)]
WndN(μ+τ,σW2)under the alternative

Для квадратичної середньої диференційованої щільності локальна асимптотична нормальність і суміжність автоматично задовольняється, що, в свою чергу, передбачає лем ле Кам. Використовуючи цю лему, нам потрібно лише обчислити під нулем. підпорядковується локальної мережі де знаходиться функція, - інформаційна матриця. Тоді, наприклад, для підписаного тестуcov(Wn,Δn)Δn

Δnhni=1nl(Xi)12h2I0
lI0Sn
cov(n(Sn1/2),Δn)=hcov(1{Xi>0},ff(Xi))=h0f=hf(0)

+1 Я не збирався заглиблюватись у таку детальну деталь (дійсно, з вашою відповіддю вже досить добре висвітлюються речі, я, мабуть, нічого не додаду до того, що я маю зараз), тож якщо ви хочете детальніше розповісти, не робіть » не стримуйте мій рахунок. У мене було б ще кілька днів (і все-таки менше, ніж у вас вже є), тож це добре, що ви прийшли.
Glen_b -Встановіть Моніку

Це гарна відповідь, особливо для додавання в лем Лемо (+1). Мені здається, існує досить великий стрибок між встановленням асимптотики в 1, 2 і 3, і бітом "отже", де ви пишете ARE. Я думаю, якби я писав це, я б визначив асимптотичну ефективність у цей момент (а може і раніше, тому підсумок пунктів 1, 2 і 3 був би АЕ не просто локальними асимптотичними силами в кожному випадку), а потім кроком майбутнім читачам було б набагато легше наслідувати ARE.
Срібна рибка

Можливо, варто вказати свій ? Односторонні та двосторонні випадки мають різну вигляд асимптотичної сили (хоча вони призводять до одних і тих же АРЕ). H1
Срібна рибка

Не соромтесь відредагувати мою відповідь або додати її до ОП.
Хашаа

1
@Khashaa Дякую Я відредагую вашу посаду, коли в мене будуть потрібні речі. Ви б заперечили уточнити значення у заключному рівнянні?
Срібна рибка

6

Це не має нічого спільного з поясненням того, чому з'являється (що було добре пояснено іншими), але може допомогти інтуїтивно. Тест Вілкоксона є -тестом у ранжирах тоді як параметричний тест обчислюється на необроблених даних. Ефективність тесту Вілкоксона відносно -тесту є площею кореляції між балами, використаними для двох тестів. Як кореляція у квадраті сходиться до . Ви можете легко побачити це емпірично за допомогою R:t Y t n ππtYtnπ3

n <- 1000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549402
[1] 0.9549297
n <- 100000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549298
[1] 0.9549297

Це дійсно дуже корисний коментар. Це трохи концептуально ближче до цього n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2(що, очевидно, дає такий же результат)?
Срібна рибка

(Люди заінтригований коментар Франка може захотіти поглянути на це питання про еквівалентність Вілкоксона-Манна-Уїтні U і т -test на ранги .)
Серебрянка

Що я не розумію у цій відповіді, це те, що кореляція вища для менших значень (я думаю, що проксимальна причина полягає в тому, що ми не бачимо хвости дуже добре для менших ). Наївно, це означає, що відносна ефективність Вілкоксона вище для малих , що мене дивує ... ?? (Я можу зробити кілька симуляцій, але (а) якщо є легка відповідь ... і (б) чи я десь пропускаю концептуальну точку?)n nnnn
Бен Болкер,

Наскільки мені здається, невелика ефективність вибірки і тестування рангів, підписаних Вілкоксоном, і WMW трохи нижче асимптотичного значення для альтернативних змін при нормальному розподілі.
Glen_b -Встановити Моніку

5

Коротка версія: Основна причина, що стосується альтернативи зміщення Вілкоксона-Манна-Вітні, полягає в тому, що пошук відносної ефективності асимптотики (WMW / t) відповідає оцінці де - загальна щільність при нулі, а - загальна дисперсія. f σ12σ2[f2(x)dx]2fσ

Отже, за нормальної величини є фактично масштабованою версією ; його інтеграл матиме термін; у квадраті це джерело . f 1f2f1ππ

Один і той же термін - з тим же інтегралом - бере участь у ARE для підписаного тесту на ранг, тому він приймає те саме значення.

Для випробування знаків відносно t ARE дорівнює ... і знову має . f ( 0 ) 24σ2f(0)2f(0)2π

Тож по суті це, як я вже сказав у коментарях; знаходиться в ARE для тесту Wilcoxon-Mann-Whitney vs двома зразком t тесту, для Wilcoxon підписаного тесту на ранговий показник проти одного зразка t та знакового випробування проти однопробного t випробування (у кожному випадку на нормальний) цілком буквально, оскільки він з'являється в нормальній щільності.π

Довідка:

Дж. Л. Ходжес та Е. Л. Леманн (1956),
"Ефективність деяких непараметричних конкурентів t-тесту",
Енн. Математика. Статист. , 27 : 2, 324-335.


Мені подобається пояснення інтуїції появи в знаменнику; чи по суті збіг, що ентропія Рені виявляється в інтегралах WMW / Wilcoxon? π
Срібляста рибка

@Silverfish Те, що з'являється , звичайно, не випадковість. Однак це не тому, що це пов'язано з ентропією Рені, або, принаймні, я не бачу прямого зв'язку. Хоча ми впадаємо в речі, про які зараз насправді не знаю. f2dx
Glen_b -Встановіть Моніку

@Silverfish Це лише ентропія Рені для . Інакше це просто звичайний старий квадрат, який може скласти мільйон різних способів. α=2
abalter
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.