Розуміння тесту Chi-квадрата та розподілу Chi-квадрата


13

Я намагаюся зрозуміти логіку тесту чи-квадрата.

Тест Chi-квадрата - . потім порівнюється з розподілом у квадраті Chi, щоб з'ясувати значення p.для того, щоб відкинути нульову гіпотезу чи ні. : спостереження походять від розподілу, який ми використовували для створення наших очікуваних значень. Наприклад, ми могли б перевірити, чи ймовірність отримання задана як ми очікуємо. Тому ми перевертаємо 100 разів і знаходимо та . Ми хочемо порівняти наші висновки з очікуваними ( ). Ми могли б також використовувати двочленний розподіл, але це не сенс питання ... Питання: χ2H0pnH1-nH100pχ2=(obsexp)2expχ2H0headpnH Heads1nH tails100p

Чи можете ви пояснити, чому під нульовою гіпотезою слідує за розподілом чи-квадрата?(obsexp)2exp

Все, що я знаю про розподіл Chi-квадрата, - це те, що розподіл chi-квадрата ступеня є сумою стандартного нормального розподілу.kkk


2
Це не так: це наближення. (Багато) більше про це з'являється в потоці на сайті stats.stackexchange.com/questions/16921/… .
whuber


Питання, пов’язані з тим, чому розподіл чі-квадрат використовується для корисності
Silverfish

Відповіді:


12

Ми могли б також використовувати біноміальне розподіл, але це не питання ...

Тим не менш, це наша відправна точка навіть для вашого актуального питання. Я висвітлю це дещо неофіційно.

Розглянемо з двочленним випадком більш загально:

YBin(n,p)

Припустимо, і такі, що добре апроксимується нормою з однаковим середнім значенням і дисперсією (деякі типові вимоги, ніж , не є малим, або що не маленький).npYmin(np,n(1p))np(1p)

Тоді буде приблизно . Тут - кількість успіхів.(YE(Y))2/Var(Y)χ12Y

Маємо і .E(Y)=npVar(Y)=np(1p)

(У випадку тестування відоме, а вказано під . Ми не робимо жодної оцінки.)npH0

Отже буде приблизно .(Ynp)2/np(1p)χ12

Зауважимо, що . Також зауважте, що .(Ynp)2=[(nY)n(1p)]21p+11p=1p(1p)

Отже,(Ynp)2np(1p)=(Ynp)2np+(Ynp)2n(1p)=(Ynp)2np+[(nY)n(1p)]2n(1p)=(OSES)2ES+(OFEF)2EF

Що є просто статистикою хі-квадрата для двочленного випадку.

Отже, у цьому випадку статистика хі-квадрата повинна мати розподіл квадрата (приблизно) стандартно-нормальної випадкової величини.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.