Чому тест коефіцієнта ймовірності розподіляється на квадрат чи?


34

Чому тестова статистика випробування на коефіцієнт ймовірності розподіляється по квадрату?

2(ln Lalt modelln Lnull model)χdfaltdfnull2



14
Дякую за довідку. Ось один із мене: stats.stackexchange.com/faq#etiquette
Доктор Біблброкс

5
Зверніть увагу на "Принесіть почуття гумору" там. Я не мав наміру бути грубим, але відповідь на це питання була б відносно стомлюючою і, в основному, міститиметься змісту цієї статті (або деяких кращих підручників зі статистики). Якщо ви заявите свою точну проблему з поясненням в одному з них, я буду радий допомогти вам.
Нік Саббе

2
Пряме посилання на оригінальний папір Вількса без платні.
ayorgo

Відповіді:


23

Як зазначав @Nick, це є наслідком теореми Вілкса . Але зауважимо, що статистика тесту асимптотично χ2 -розподілена, а не χ2 -розподілена.

Мене дуже вразила ця теорема, оскільки вона дотримується у дуже широкому контексті. Розглянемо статистичну модель з вірогідністю l(θy) де y - векторні спостереження n незалежних повторних спостережень з розподілу з параметром θ що належить підскладному B1 з Rd з розмірністю dim(B1)=s . Нехай B0B1 - підмножина з розмірністю . Уявіть, що вам цікаво тестувати H 0 : { θ B 0 } .dim(B0)=mH0:{θB0}

Коефіцієнт ймовірності дорівнює Визначтевідхиленняd(y)=2log(lr(y)). Тодітеорема Вілксаговорить, що за звичайних припущень щодо закономірностіd(y)асимптотичноχ2-розподілений зs-mступенів свободи, колиH0справедливо.

lr(y)=supθB1l(θy)supθB0l(θy).
d(y)=2log(lr(y))d(y)χ2smH0

Це підтверджено в оригінальному документі Вілка, згаданому @Nick. Я думаю, цей документ читати непросто. Пізніше Вілкс опублікував книгу, можливо, з найпростішим викладом своєї теореми. Короткий евристичний доказ наведений у чудовій книзі Вільямса .



5
Ой давай Стефане. Це Вікіпедія, ви можете її редагувати та вдосконалювати!
Стаск

1
@StasK Я це знаю, але ніколи не пробував. І я вже витрачаю занадто багато часу на своє життя зі статистикою та математикою;)
Stéphane Laurent

Чи існує інтуїція, чому 2 знаходиться перед журналом у визначенні відхилення?
користувач56834

@ Programmer2134 Отримано з розширення Тейлора другого порядку.
Френк Вел

25

Я другий суворий коментар Ніка Саббе, і моя коротка відповідь: це не так . Я маю на увазі, це лише у звичайній лінійній моделі. Для абсолютно будь-яких інших обставин точний розподіл не є . У багатьох ситуаціях можна сподіватися, що умови теореми Вілкса виконані, і тоді асимптотично статистика тестування коефіцієнта ймовірності збігається в розподілі до χ 2 . Обмеження та порушення умов теореми Вілкса занадто багато, щоб їх нехтувати.χ2χ2

  1. Теорема передбачає, що дані про очікують виникнення проблем із залежними даними, такими як часові ряди чи неоднакові зразки обстеження ймовірностей (для яких так чи інакше вірогідність визначена; "регулярні" χ 2 тести, такі як тести на незалежність у таблицях на випадок надзвичайних ситуацій, починають вести себе як сума k a k v k , v kiid χ 2 1 ( Rao & Scott ). Для iid даних a k = 1 , а сума стає χ 2. Але для незалежних даних це не довше справа.χ2kakvk,vki.i.d.χ12ak=1χ2
  2. Теорема передбачає, що справжній параметр знаходиться у внутрішній частині простору параметрів. Якщо у вас є евклідовий простір для роботи, це не проблема. Однак у деяких проблемах можуть виникнути природні обмеження, такі як дисперсія 0 або кореляція між -1 і 1. Якщо істинним параметром є одна межа, то асимптотичний розподіл - це суміш χ 2 з різним ступенем свободи, в тому сенсі, що cdf тесту - це сума таких cdfs ( Ендрюс 2001 , плюс ще два-три його статті за той самий період, історія - ще до Черноффа 1954 ).χ2
  3. Теорема передбачає, що всі відповідні похідні є ненульовими. Це може бути оскаржено деякими нелінійними проблемами та / або параметризаціями та / або ситуаціями, коли параметр не ідентифікується під нулем. Припустимо, у вас є модель гауссової суміші, і ваша нуль - це один компонент проти альтернативи двох різних компонентів f N ( μ 1 , σ 2 1 ) + ( 1 - f ) N ( μ 2 , σ 2 2 )N(μ0,σ02)fN(μ1,σ12)+(1f)N(μ2,σ22)зі змішувальною фракцією . Нуль, мабуть, вкладений в альтернативу, але це може бути виражено різними способами: як f = 0 (у цьому випадку параметри μ 1 , σ 2 1 не ідентифіковані), f = 1 (у цьому випадку μ 2 , σ 2 2 не ідентифікуються), або μ 1 = μ 2 , σ 1 = σ 2 (у цьому випадку fff=0μ1,σ12f=1μ2,σ22μ1=μ2,σ1=σ2fне ідентифікується). Тут ви навіть не можете сказати, скільки ступенів свободи повинен мати ваш тест, оскільки у вас є різна кількість обмежень залежно від того, як ви параметризуєте введення. Дивіться роботу Цзяхуа Чен з цього приводу, наприклад CJS 2001 .
  4. може працювати нормально , якщо розподіл було зазначено правильно. Але якщо цього не було, тест знову зламається. У (переважно знехтуваної статистиками) підрайон багатофакторного аналізу, відомий як моделювання коваріації структурних рівнянь, часто передбачається багатоваріантне нормальне розподіл, але навіть якщо структура правильна, тест буде невідповідним, якщо розподіл буде іншим. Satorra та Bentler 1995 показують, що розподіл стане k a k v k , v kiid χ 2 1 , та ж історія, що і з незалежними даними в моєму пункті 1, але вони також продемонстрували, якχ2kakvk,vki.i.d.χ12 s залежать від структури моделі та четвертого моменту розподілу.ak
  5. Prob[d(y)x]=F(x;χd2)[1+O(n1)]nF(x;χd2)χd2bProb[d(y)/(1+b/n)x]=F(x;χd2)[1+O(n2)]χ2b

Для огляду цих та подібних езотеричних питань з можливим висновком див. Smith 1989 .


1
B0B1 χ2

З відомою дисперсією слід додати.
StasK
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.