Як перевірити, чи


9

Припустимо, у мене є три незалежні групи із середнім значенням μ1, μ2, μ3 відповідно.

Як я можу перевірити, чи μ1<μ2<μ3 або не використовує n1, n2, n3 зразки з кожної групи?

Я хочу знати загальну методологію, а не детальний розрахунок. Я не міг зрозуміти, як поставити свою гіпотезуH0 і H1.


1
Це випадок статистичного висновку з обмеженим порядком . На тему є книги .
kjetil b halvorsen

1
Є також стара книга Барлоу, Бартолемея, Бремнера та Брунка Статистичний висновок з обмеженнями порядку (1973) (хоча з тих пір були певні зрушення); що стосується непараметричних тестів, то тут є тест Джонкхере-Терпстра (наприклад, див. Коновер) та один із тестів Match (спробуйте книгу Нева та Уортінгтона). Зазвичай ви пишете нульову рівність та замовлену альтернативу.
Glen_b -Встановити Моніку


Тут слід сказати, не те, що є ni зразки з групи i, але у цього є зразок розміру ni з групи i.
Майкл Харді

Відповіді:


8

У статистиці ви не можете перевірити, чи є "X правдивим чи ні". Можна лише спробувати знайти докази того, що нульова гіпотеза помилкова.

Скажімо, ваша нульова гіпотеза така

H01:μ1<μ2<μ3.
Припустимо також, що у вас є спосіб оцінки вектора μ=(μ1,μ2,μ3). Щоб утримати речі, просто припускайте, що у вас є оцінювач
xN(μ,Σ),
де Σ є 3×3коваріатна матриця. Ми можемо переписати нульову гіпотезу як
Aμ<0,
де
A=[110011].
Це показує, що ваша нульова гіпотеза може бути виражена як обмеження нерівності вектора Aμ. Природний оцінювачAμ дається
AxN(Aμ,AΣA).
Тепер ви можете використовувати рамку для тестування обмежень нерівності для звичайних векторів, наведених у:

Кудо, Акіо (1963). "Багатоваріантний аналог однобічного тесту". В: Біометріка 50.3 / 4, с. 403–418.

Цей тест також буде працювати, якщо припущення про нормальність дотримується лише приблизно ("асимптотично"). Наприклад, це спрацює, якщо ви зможете намалювати зразки засобів із груп. Якщо ви малюєте зразки розміруn1,n2,n3 і якщо ви можете малювати незалежно від груп, то Σ є діагональною матрицею з діагоналлю

(σ12/n1,σ22/n2,σ32/n3),
де σk2 - дисперсія в групі k=1,2,3. У додатку ви можете використовувати вибіркову дисперсію замість невідомої дисперсії сукупності, не змінюючи властивостей тесту.

Якщо, з іншого боку, ваша альтернативна гіпотеза

H12:μ1<μ2<μ3
тоді ваша нульова гіпотеза стає
H02:NOT H1.
Це не дуже оперативно. Пам'ятайте, що нашу нову альтернативну гіпотезу можна записати якH1:Aμ<0 так що
H02:there exists a k=1,2 such that (Aμ)k0.
Я не знаю, чи існує якийсь спеціалізований тест для цього, але ви точно можете спробувати якусь стратегію на основі послідовного тестування. Пам'ятайте, що ви намагаєтесь знайти докази проти нуля. Тож ви можете спершу випробувати
H0,12:(Aμ)10.
і потім
H0,22:(Aμ)20.
Якщо ви відкидаєте обидва рази, то ви знайшли докази того H0 неправдиво, і ви відкидаєте H0. Якщо ви цього не зробите, то не відмовляєтесьH0. Оскільки ви тестуєте кілька разів, вам доведеться відрегулювати номінальний рівень субтесту. Ви можете скористатися корекцією Бонферроні або визначити точну корекцію (оскільки ви знаєтеΣ).

Ще один спосіб побудови тесту для H02 це зауважити

H02:maxk=1,2(Aμ)k0.
Це означає використання maxAxяк тестова статистика. Тест матиме нестандартний розподіл під нулем, але відповідне критичне значення все одно має бути досить легко обчислити.


Досить справедливо, я відредагував свою відповідь.
Andreas Dzemski

Гарна відповідь (+1). Просто, щоб трохи покращити його, я можу порекомендувати замінитих з мк^ так що позначення відображає наміри, що цей об'єкт є оцінкою мк.
Бен -

1

Відповідь, надана @ andreas-dzemski, є правильною лише в тому випадку, якщо ми знаємо, що дані зазвичай поширюються.

Якщо ми не знаємо розподілу, я вважаю, що було б краще провести непараметричний тест. У цьому випадку найпростішим видається тест на перестановку. Це книга про цю тему, і це приємне онлайн-пояснення. Нижче я включаю код R для обчислення цього тесту.

# some test data
D <- data.frame(group1=c(3,6,2,2,3,9,3,4,2,5), group2=c(5,3,10,1,10,2,4,4,2,2), group3=c(8,0,1,5,10,7,3,4,8,1))

# sample with replacement
resample <- function(X) sample(X, replace=TRUE)

# return true if mu1 < mu2 < mu3
test     <- function(mu1, mu2, mu3) (mu1 < mu2) & (mu2 < mu3)

# resampling test that returns the probability of observing the relationship
mean(replicate(1000, test(mean(resample(D$group1)), mean(resample(D$group2)), mean(resample(D$group3)))))
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.