Нормально розподілені помилки та центральна гранична теорема


9

У Вступній економетрії Вулдріджа є цитата:

Аргумент, що виправдовує нормальний розподіл помилок, зазвичай працює приблизно так: тому що у - це сукупність безлічі різних спостережуваних факторів, що впливають у, можна зробити висновок про центральну граничну теорему, щоб зробити висновок про це у має приблизний нормальний розподіл.

Ця цитата стосується одного з припущень лінійної моделі, а саме:

уN(мк,σ2)

де - термін помилки в моделі населення.у

Зараз, наскільки я знаю, теорема про центральну межу говорить, що розподіл

Zi=(Yi¯-мк)/(σ/н)

(де - середні значення випадкових вибірок, узятих з будь-якої сукупності із середнім та дисперсією )Yi¯мкσ2

наближається до стандартної звичайної змінної як .н

Питання:

Допоможіть мені зрозуміти, як означає асимптотична нормальністьZiуN(мк,σ2)

Відповіді:


13

Це може бути краще оцінено, виражаючи результат CLT у вигляді сум iid випадкових величин. Ми маємо

нХ¯-мкσN(0,1)асимптотично

Помножте коефіцієнт на і використовуйте той факт, що для отриманняσнVаr(cХ)=c2Vаr(Х)

Х¯-мкN(0,σ2н)

Тепер додайте в LHS і використовуйте той факт, що для отриманнямкЕ[аХ+мк]=аЕ[Х]+мк

Х¯=1нi=1нХiN(мк,σ2н)

Нарешті, помножте на і скористайтеся двома наведеними вище результатами, щоб побачити цен

i=1нХiN(нмк,нσ2)

І що це стосується твердження Вулдріджа? Ну, якщо помилка є сумою багатьох iid випадкових змінних, вона буде приблизно нормально розподілена, як тільки що бачили. Але тут виникає проблема, а саме те, що спостережувані фактори не обов'язково будуть ідентично розподілені, і вони можуть бути навіть не незалежними!

Тим не менш, CLT було успішно розширено до незалежних не однаково розподілених випадкових величин і навіть випадків легкої залежності при деяких додаткових умовах регулярності. Це, по суті, умови, які гарантують, що жоден термін у сумі не чинить непропорційний вплив на асимптотичний розподіл, див. Також сторінку Вікіпедії на CLT . Звичайно, вам не потрібно знати ці результати; Метою Вулдріджа є лише інтуїція.

Сподіваюсь, це допомагає.


Я додам (оскільки автор вивчає економетрику), що в його галузі дослідження багато випадкових змінних (принаймні тих, що використовуються для моделювання) не мають 1-го моменту, наприклад розподілу Коші. Тож CLT - це не той, на кого можна покластися у цій галузі.
Німець Демидов
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.