Чому розподіл дисперсії вибірки є розподілом у квадраті?


22

Заява

Розподіл вибірки дисперсії вибірки - це розподіл у квадратичній формі зі ступенем свободи, рівним , де - розмір вибірки (враховуючи, що випадкова змінна величина, що становить інтерес, зазвичай розподіляється).nн-1н

Джерело

Моя інтуїція

Це ніби має для мене інтуїтивний сенс 1) тому, що тест чі-квадрата виглядає як сума квадрата і 2) тому, що розподіл Chi-квадрата - це лише сума нормального розподілу у квадраті. Але все-таки я не дуже добре розумію це.

Питання

Чи твердження правдиве? Чому?


1
Початкове твердження в цілому помилкове (помилкове з двох окремих причин). Яке джерело (ваше посилання відсутнє), і що воно насправді говорить?
Glen_b -Встановити Моніку

На моє запитання також виникає реакція на запитання-відповідь у вступному класі статистики, для якого захищений доступ. Питання: "Який розподіл є розподілом вибірки дисперсії довжини крила у мух?" а відповідь - "Розподіл у квадраті"
Remi.b

1
Цитоване твердження у вашому першому коментарі все ще помилкове. Коментар в кінці джерела правдивий (з необхідними припущеннями): " коли вибірки розміру n беруть із звичайного розподілу з дисперсією , розподіл вибірки має чі-квадратний розподіл із n-1 ступенем свободи. ( n - 1 ) s 2 / σ 2σ2(n1)s2/σ2 "... Відповідь на запитання у вашому другому коментарі також буде хибною - якщо, напевно, хтось не показав, що довжина крила зазвичай розподілений. (Яка підстава може бути твердженням, що це правда?)
Glen_b -Встановити Моніку

Отже, припустимо, що крила звичайно розподілені, тоді розподіл вибірки буде розподілено чі-квадратом. Чому так? (n1)s2/σ2
Remi.b

Чи знаєте ви, що сума квадратів iid N (0,1) випадкових величин chi-квадрат з df? Або це та частина, яку ви шукаєте доказ? kkк
Glen_b -Встановіть Моніку

Відповіді:


27

[Я вважаю з обговорення у вашому запитанні, що ви раді прийняти як факт, що якщо є незалежними однаково розподіленими випадковими змінними, то .]N ( 0 , 1 ) k i = 1 Z 2 iχ 2 kZi,i=1,2,,kN(0,1)i=1kZi2χk2

Формально потрібний результат випливає з теореми Кокрана . (Хоча це може бути показано і іншими способами)

Менш формально, врахуйте, що якби ми знали популяцію, і оцінили різницю щодо неї (а не про середню вибірку): , тоді , ( ), який буде разів випадкова величина .s 2 0 /σ2=1s02=1ni=1n(Xiμ)2 Zi=(Xi-μ)/σ1s02/σ2=1ni=1n(Xiμσ)2=1ni=1nZi2Zi=(Xiμ)/σ χ 2 n1nχn2

Той факт, що використовується середнє значення вибірки, замість середнього значення сукупності ( ) робить суму квадратів відхилень меншою, але точно таким чином, що (про що див. теорему Кокрана). Отже, замість нас зараз .Zi=(XiX¯)/σi=1n(Zi)2χn12ns02/σ2χn2(n1)s2/σ2χn12


@Glen_b Чи можете ви дати посилання на інші докази цього факту? Я дуже хочу це знати.
Генрі.Л

Який із кількох фактів ви підтверджуєте?
Glen_b -Встановіть Моніку

@Glen_b Єдиними двома методами, окрім теореми Кокрана-Мадова, що підтверджують той факт, що дисперсія вибірки та середнє значення вибірки є статистично незалежними при розподілі c-квадрата: (1) Канонічна основа Шеффа (Scheffe, 1959) (2) Методи кумуляції (Або mgfs, що їй рівнозначно). Якщо ви знаєте більше методів, я дуже хочу їх знати.
Генрі.L

Ще один коментар, який я хочу додати, - це те, що використовується дуже низьке значення вибірки, але іноді ми хочемо фіксовану потужність, незалежну від фіксованої дисперсії, цей метод замінюється двоступеневим методом Штейна (1949).
Генрі.Л

Чого я не отримую щодо цієї відповіді, це те, що не є незалежним від усіх , тож як ми можемо застосувати теорему Кокрана? там сказано, що всі вони повинні бути незалежними. X¯Xiс
user56834
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.