Простіше спочатку опрацювати випадок, коли відомі коефіцієнти регресії, а нульова гіпотеза проста. Тоді достатньою статистикою є , де - залишковий; його розподіл під нулем також є чи-квадратом, масштабованим на & зі ступенями свободи, рівними розміру вибірки .T=∑z2zσ20n
Запишіть співвідношення ймовірностей під & та підтвердьте, що це функція збільшується, для будь-якого :σ=σ1σ=σ2Tσ2>σ1
Функцією відношення ймовірності журналу є , і прямо пропорційна з позитивним градієнтом, коли .Tσ2>σ1
ℓ(σ2;T,n)−ℓ(σ1;T,n)=n2⋅[log(σ21σ22)+Tn⋅(1σ21−1σ22)]
Tσ2>σ1
Отже, за теоремою Карліна – Рубіна кожен з односхилих тестів проти & проти є рівномірно найпотужнішим. Очевидно, що немає тестування UMP проти . Як обговорювалося тут , проведення односхилих тестів та застосування виправлення багаторазових порівнянь призводить до загальновживаного тесту з областями відхилення однакового розміру в обох хвостах, і цілком розумно, коли ви збираєтесь стверджувати, що або що коли ви відхиляєте нуль.H A : σ < σ 0 H 0 : σ = σ 0 H A : σ < σ 0 H 0 : σ = σ 0 H A : σ ≠ σ 0 σ > σ 0 σ < σ 0H0:σ=σ0HA:σ<σ0H0:σ=σ0HA:σ<σ0H0:σ=σ0HA:σ≠σ0σ>σ0σ<σ0
Далі знайдіть відношення ймовірностей під , оцінку максимальної ймовірності , & : сг сг = сг 0σ=σ^σσ=σ0
Оскільки , статистика тесту на відношення ймовірності журналу дорівнюєσ^2=Tn
ℓ(σ^;T,n)−ℓ(σ0;T,n)=n2⋅[log(nσ20T)+Tnσ20−1]
Це прекрасна статистика для кількісного визначення того, наскільки дані підтримують за . І довірчі інтервали, сформовані в результаті інвертування тесту на коефіцієнт ймовірності, мають привабливу властивість, що всі значення параметрів всередині інтервалу мають більш високу ймовірність, ніж значення зовні. Асимптотичний розподіл у два рази більше коефіцієнта вірогідності логарифів добре відомий, але для точного тестування не потрібно намагатися розробити його розподіл - просто використовуйте хвостові ймовірності відповідних значень у кожному хвості.HA:σ≠σ0H0:σ=σ0T
Якщо ви не можете провести рівномірно найпотужніший тест, можливо, вам потрібен найпотужніший проти альтернатив, найближчих до нуля. Знайдіть похідну функції вірогідності журналу відносно - функції оцінки:σ
dℓ(σ;T,n)dσ=Tσ3−nσ
Оцінюючи його величину в дає місцевий найпотужніший тест проти . Оскільки статистика тесту обмежена внизу, при невеликих зразках область відхилення може бути приурочена до верхнього хвоста. Знову ж таки, асимптотичний розподіл шкали у квадраті добре відомий, але ви можете отримати точний тест так само, як і для LRT.σ0H0:σ=σ0HA:σ≠σ0
Інший підхід полягає в обмеженні вашої уваги неупередженими тестами, а саме тих, для яких потужність за будь-якої альтернативи перевищує розмір. Перевірте, чи достатня статистика має розподіл у експонентній родині; то для тесту на розмір , якщо або , інакше , ви можете знайти рівномірно найпотужніший неупереджений тест, вирішивши
αϕ(T)=1T<c1T>c2ϕ(T)=0
E(ϕ(T))E(Tϕ(T))=α=αET
Сюжет допомагає показати зміщення в тесті з рівними хвостами та як він виникає:
При значеннях трохи більше збільшена ймовірність падіння статистики тесту у відхиленні верхнього хвоста відхилення не компенсує зменшену ймовірність його падіння в області відхилення нижнього хвоста та потужність тестові краплі нижче його розміру.σ 0σσ0
Бути неупередженим - це добре; але не очевидно, що мати потужність, трохи меншу за розмір у невеликій області простору параметрів в межах альтернативи, так погано, що взагалі виключати тест.
Два з перерахованих вище двоступеневих тестів збігаються (для цього випадку, як правило, не:)
LRT є UMP серед об'єктивних тестів. У випадках, коли це не відповідає дійсності, LRT все ще може бути асимптотично неупередженим.
Я думаю, що всі, навіть односхилі тести, допустимі, тобто тест не є більш потужним або настільки потужним за всіх альтернатив - ви можете зробити тест більш потужним проти альтернативних в одному напрямку, лише зробивши його менш потужним проти альтернатив в іншому. напрямок. Зі збільшенням розміру вибірки розподіл чі-квадрата стає все більш симетричним, і всі двосхилі тести в кінцевому підсумку будуть приблизно однаковими (ще одна причина використання легкого тесту з рівними хвостами).
Зі складеною нульовою гіпотезою аргументи стають дещо складнішими, але я думаю, ви можете отримати практично однакові результати, mutatis mutandis. Зауважте, що один, але не інший з однохвостих тестів - це UMP!