Вам не потрібні припущення щодо 4-го моменту для послідовності оцінки ОЛС, але вам потрібні припущення щодо вищих моментів та для асимптотичної нормальності та послідовної оцінки того, що таке асимптотична матриця коваріації.xϵ
У деякому сенсі це математичний, технічний, а не практичний момент. Щоб OLS добре працював у кінцевих зразках, в якомусь сенсі потрібно більше мінімальних припущень, необхідних для досягнення асимптотичної послідовності або нормальності як .n→∞
Достатні умови консистенції:
Якщо у вас є рівняння регресії:
yi=x′iβ+ϵi
Оцінювач OLS можна записати так:
b^
b^=β+(X′Xn)−1(X′ϵn)
Для послідовності потрібно мати змогу застосувати Закон Колмогорова про великі числа або, у випадку часових рядів із серійною залежністю, щось на кшталт ергодичної теореми Карліна та Тейлора, щоб:
1nX′X→pE[xix′i]1nX′ϵ→pE[x′iϵi]
Інші необхідні припущення:
- E[xix′i] є повним рангом і, отже, матриця є незворотною.
- Регресори заздалегідь визначені або строго екзогенні, так що .E[xiϵi]=0
Тоді і ви отримуєте(X′Xn)−1(X′ϵn)→p0b^→pβ
Якщо ви хочете, щоб центральна гранична теорема для застосування , то вам потрібно припущень про більш високих моментах, наприклад, , де . Центральна гранична теорема - це те, що дає вам асимптотичну нормальність і дозволяє говорити про стандартні помилки. Щоб другий момент існував, вам потрібні 4 моменти та . Ви хочете стверджувати, що кудиE[gig′i]gi=xiϵib^E[gig′i]xϵn−−√(1n∑ix′iϵi)→dN(0,Σ)Σ=E[xix′iϵ2i] . Щоб це працювало, має бути кінцевим.Σ
Хороша дискусія (яка мотивується цей пост) дається в Хаяши економетрики . (Див. Також стор. 149 для 4-х моментів та оцінки матриці коваріації.)
Обговорення:
Ці вимоги до 4-х моментів, мабуть, є технічним, а не практичним. Ви, мабуть, не зіткнетеся з патологічними поширеннями, де це проблема в повсякденних даних? Це для більш поширених або інших припущень OLS, щоб зійти з ладу.
Інше питання, на яке, безсумнівно, відповіли в іншому місці Stackexchange, - це наскільки велика кількість вибірки вам потрібна для кінцевих зразків, щоб наблизитися до асимптотичних результатів. Існує певний сенс, в якому фантастичні люди, що виживають, призводять до повільної конвергенції. Наприклад, спробуйте оцінити середнє значення лонормального розподілу з дійсно високою дисперсією. Середня вибірка - це послідовний, неупереджений середній показник популяції, але в цьому випадку нормального випадку з безумним надлишком куртозу тощо.
Кінцеве проти нескінченного є надзвичайно важливою відмінністю в математиці. Це не проблема, з якою ви стикаєтесь у щоденній статистиці. Практичні проблеми більше в малій та великій категорії. Чи є дисперсія, куртоз тощо ... досить маленькою, щоб я міг досягти розумних оцінок, враховуючи розмір вибірки?
Патологічний приклад, коли оцінювач OLS є послідовним, але не асимптотично нормальним
Поміркуйте:
yi=bxi+ϵi
Де але з t-розподілу з двома ступенями свободи, таким чином . Оцінка OLS сходиться з ймовірністю до але вибірковий розподіл для оцінки OLS зазвичай не розподіляється. Нижче наводиться емпіричний розподіл для на основі 10000 моделювання регресії з 10000 спостереженнями.
xi∼N(0,1)ϵiVar(ϵi)=∞bb^b^
Розподіл не є нормальним, хвости занадто важкі. Але якщо ви збільшите градуси свободи до 3, щоб другий момент , тоді застосовується центральна межа, і ви отримаєте:
b^ϵi
Код для його створення:
beta = [-4; 3.7];
n = 1e5;
n_sim = 10000;
for s=1:n_sim
X = [ones(n, 1), randn(n, 1)];
u = trnd(2,n,1) / 100;
y = X * beta + u;
b(:,s) = X \ y;
end
b = b';
qqplot(b(:,2));