Чому дані слід переутворювати під нульовою гіпотезою під час тестування гіпотез під час завантаження?


11

Безпосереднє застосуванням методів бутстраповскіх для перевірки гіпотез є оцінка довірчого інтервалу тестової статистики & thetas шляхом багаторазового його розрахунку на бутстраповскіх зразках (Нехай статистика θ вибірку з початкового завантаження можна назвати ^ θ * ). Ми відкидаємо якщо гіпотезований параметр (який зазвичай дорівнює 0) лежить поза довірчим інтервалом .θ^θ^θ^θ 0 ^ θ H0θ0θ^

Я читав, що цьому методу бракує певної сили. У статті Холла П. та Вілсона С.Р. "Два настанови щодо тестування гіпотез Bootstrap" (1992) написано як перше керівництво, що слід перепропонувати , а не . І це частина, яку я не розумію.^ θ * -θ0θ^θ^θ^θ0

Чи не те, що вимірює лише зміщення оцінювача ? Для неупереджених оцінювачів інтервали довіри цього виразу завжди повинні бути меншими, ніж , але я не бачу, що це стосується тестування на ? я не бачу, як ми помістили інформацію про .^ θ * ^ θ * -θ0 θ =θ0θ0θ^θ^θ^θ^θ0θ^=θ0θ0


Для тих із вас, хто не має доступу до цієї статті, це цитата відповідного пункту, що надходить одразу після дипломної роботи:

Щоб зрозуміти, чому це важливо, зауважте, що тест передбачає відхилення якщо в "занадто великий". Якщо - довгий шлях від справжнього значення (тобто, якщо є грубо помилкою), то різниця ніколи не буде виглядати занадто великим порівняно з непараметричним розповсюдженням завантажувальної програми. Більш змістовне порівняння - з розподілом. Насправді, якщо справжнє значення дорівнює| Θ - θ 0 | θ 0 θ H 0H0|θ^θ0|θ0θH0| Θ - θ 0 | | ^ | Θ - θ 0 ||θ^θ0||θ^θ0|θθ1| θ1-θ0| | ^ Θ * - θ | | θ1-θ0||θ^θ^|θθ1тоді потужність тесту завантажувальної програми збільшується до 1, якзбільшується за умови тестування на основі переупорядкування , але потужність зменшується до рівня значущості (оскільки збільшується), якщо тест базується на переустановці |θ1θ0||θ^θ^||θ1θ0||θ^θ0|

Відповіді:


7

Це принцип аналогії завантажувача. (Невідомий) основний істинний розподіл дав зразок під рукою з cdf , що, в свою чергу, створило статистику для деякого функціонального . Ваша ідея використання bootstrap полягає в тому, щоб робити заяви про розподіл вибірки на основі відомого розподілу , де ви намагаєтесь використовувати ідентичний протокол вибірки (який точно можливий лише для даних iid; залежні дані завжди призводять до обмежень у тому, як точно можна відтворити процес вибірки) і застосувати той самий функціональний . Я продемонстрував це в іншому постіх 1 , ... , х п Р п θ = Т ( Р п ) Т ( ) ~ Р Т ( ) θ - θ 0 θ * ~ Р Т ( ) Т ( ~ Р ) ~ Р = Р п Т ( Р п ) ≡ & thetas ;Fx1,,xnFnθ^=T(Fn)T()F~T()з (що я вважаю) акуратною схемою. Отже, аналог завантажувальної програми (вибірки + систематичне) відхилення , кількість вашого центрального інтересу, - це відхилення репліки завантажувача від того, що, як відомо, є правдивим для розподілу , процес вибірки, який ви застосували, і функціональний , тобто ваш показник центральної тенденції - . Якщо ви використовували стандартний непараметричний завантажувальний засіб із заміною вихідних даних, ваш , тож ваш показник центральної тенденції має бути на основі вихідних даних.θ^θ0θ^F~T()T(F~)F~=FnT(Fn)θ^

Окрім перекладу, з тестами завантажувальної програми, які часом важко подолати, виникають тонкі питання. Розподіл тестової статистики під нуль може кардинально відрізнятися від розподілу тестової статистики під альтернативу (наприклад, у тестах на межі простору параметрів, які виходять з ладу під час завантаження ). Прості тести, які ви вивчаєте на бакалавратських класах, наприклад -test, є інваріантними під час зміни, але думка "Чорт, я просто перекладаю все" провалюється, як тільки вам доведеться перейти до наступного рівня концептуальної складності, асимптотичного тесту. Подумайте над цим: ви тестуєте, що , і ваш спостережуваний . Тоді, коли ви будуєте aχ 2 μ = 0 ˉ x = 0,78 χ 2 ( ˉ x - μ ) 2 / ( s 2 / n ) ˉ x 2 / ( s 2 / n ) ˉ x 2 / ( s 2 / n ) n ˉ x 2 / s 2tχ2μ=0x¯=0.78χ2 тест з аналогом завантаження , то цей тест з самого початку має вбудовану нецентральність , замість того, щоб бути центральним тестом, як ми би очікували. Щоб зробити тест завантажувальної програми центральним, потрібно дійсно відняти початкову оцінку.(x¯μ)2/(s2/n)x¯2/(s2/n)x¯2/(s2/n)nx¯2/s2

В випробування неминуче в різноманітних контекстах, починаючи від Pearson для таблиць спряженості в Bollen-Стін бутстрап тестової статистики в структурних моделях рівнянь. Концепцію зміщення розподілу вкрай складно визначити в цих ситуаціях ... хоча у випадку тестів на багатоваріантних матрицях коваріації це можна зробити за допомогою відповідного обертання .χ 2χ2χ2


Дякую. Є одна думка, яку я досі не розумію: куди ми поміщаємо інформацію про у завантажувальну ? Якщо помилковий, може бути значно вимкненим з істинного розподілу. H 0 θ 0θ0H0θ0
Адам Ріцковський

Ви обчислюєте значення p під нулем, тому вам слід розглянути випадок, коли відповідає нулю. Розглядати альтернативу, звичайно, варто за допомогою альтернативи, але це ... вау ... це було б вдосконаленим методологією тестування завантажувальної програми. θ0
Стаск

3

Гаразд, я це зрозумів. Дякую, Стаск, за таку хорошу відповідь. Я буду прийнятим, щоб інші навчалися, але в моєму конкретному випадку мені не вистачало дуже простого факту:

Процедура завантажувального завантаження відповідно до вказівок Холла і Вілсона для простого середнього вибіркового тесту є такою (в псевдокодексі, натхненному R):

1function(data,θ0 ) {
2 thetas00 ^ & thetas ; * & thetas ; ^ & thetas ; *θ^ t.test(data, mu = θ0 )$statistic
3 count 0
4for(i in 1:1000){
5 bdata sample(data)
6 θ^ t.test(bdata, mu = θ^ )$statistic
7 if ( θ^θ^ ) count++
8 }
9 count/1000
10 }

Частина, яку я пропустив, полягала в тому, що "використовується" у рядку (де ми встановлюємо посилання ).θθ02θ^

Цікаво зазначити, що в рядку 2і 6ми могли однаково легко використовувати p.valueзамість цього statistic. У такому випадку ми також повинні змінити в у рядку .7


Я виступав раніше, але потім зрозумів, що це насправді неправильно. Згідно Холл і Вілсону (розділ 2, стор. 278), - це оцінювач , а не тестова статистика, як ви показали. Спосіб, що вступає в гру, полягає в тому, що ми формуємо повторно розподілений розподіл , а потім подивимося, чи виглядає "екстремально" порівняно з перекомпонованим розподілом. ; & thetasthetas0( & thetas ; * - & thetas ; )( & thetas ; -thetas0)θ^θθ0(θ^θ^)(θ^θ0)
половина минути

1
Можливо, корисно: Майкл Черник надав лаконічну інтуїцію, відповідаючи на моє тут пов’язане питання. stats.stackexchange.com/questions/289236 / ... )
половина прохід
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.