Припущення про найменші квадрати


9

Припустимо наступне лінійне співвідношення: , де - залежна змінна, - одна незалежна змінна та - термін помилки.Yi=β0+β1Xi+uiYiXiui

Згідно зі словами Stock & Watson (Вступ до економетрії; Глава 4 ), припущення третього найменшого квадрата - це те, що четверті моменти та є ненульовими та кінцевими .Xiui(0<E(Xi4)< and 0<E(ui4)<)

У мене три питання:

  1. Я не повністю розумію роль цього припущення. Чи є OLS упередженим і непослідовним, якщо це припущення не відповідає чи нам це припущення потрібно для висновку?

  2. Сток і Уотсон пишуть "це припущення обмежує ймовірність провести спостереження з надзвичайно великими значеннями або ". Однак моя інтуїція полягає в тому, що це припущення є крайнім. Чи ми маємо біду, якщо у нас є великі люди (такі, що четверті моменти є великими), але якщо ці значення все ще кінцеві? До речі: що є основним визначенням зовнішнього вигляду?Xiui

  3. Чи можемо ми переформулювати це так: "Куртоз і - ненульовий і кінцевий?"Xiui


На жаль, зараз не можу написати повноцінну відповідь, але щоб відповісти на ваше запитання: 1, послідовність OLS працює незалежно. 2, чіткого визначення випускників не існує, але OLS прекрасно працює у великій вибірці за наявності людей, що переживають люди. 3, на все життя я не можу придумати приклад, коли це не було би правдою, але хтось міг довести мене неправильно, тому жодних гарантій
Repmat

5
Я заперечую, "але OLS прекрасно спрацьовує у великій вибірці за наявності аутлієрів" ... візьміть достатньо великий розмір в x-просторі (тобто впливове спостереження), і одна точка може змусити ЛС підходити пройти через нього; якщо це також є стороннім у напрямку Y, ваша лінія все одно піде, хоча ця точка, якою б екстремальною вона не була.
Glen_b -Встановити Моніку

2
Визначити людину легко. Вони є спостереженнями, невідповідними шаблону основної маси даних. Як показує приклад Glen_b, такі точки мають надмірний вплив на придатність, на межу переважуючи всі інші спостереження в наборі даних, приводячи до дуже упереджених оцінок.
користувач603

1
@ user603 Зрозуміло ... і так, що ... Мені ще доводиться стикатися з програмою / сценарієм, який автоматично виявляє людей, що переживають люди, і роблять це чітко, що ми всі погоджуємось - це правильний шлях ... тому я погоджуюся з вашими настроями, це не допомагає OP
Repmat

@Repmat: перечитайте питання ОП. Мій коментар безпосередньо відповідає на одне із пропозицій, яке перебуває в розділі знака питання.
user603

Відповіді:


9

Вам не потрібні припущення щодо 4-го моменту для послідовності оцінки ОЛС, але вам потрібні припущення щодо вищих моментів та для асимптотичної нормальності та послідовної оцінки того, що таке асимптотична матриця коваріації.xϵ

У деякому сенсі це математичний, технічний, а не практичний момент. Щоб OLS добре працював у кінцевих зразках, в якомусь сенсі потрібно більше мінімальних припущень, необхідних для досягнення асимптотичної послідовності або нормальності як .n

Достатні умови консистенції:

Якщо у вас є рівняння регресії:

yi=xiβ+ϵi

Оцінювач OLS можна записати так: b^

b^=β+(XXn)1(Xϵn)

Для послідовності потрібно мати змогу застосувати Закон Колмогорова про великі числа або, у випадку часових рядів із серійною залежністю, щось на кшталт ергодичної теореми Карліна та Тейлора, щоб:

1nXXpE[xixi]1nXϵpE[xiϵi]

Інші необхідні припущення:

  • E[xixi] є повним рангом і, отже, матриця є незворотною.
  • Регресори заздалегідь визначені або строго екзогенні, так що .E[xiϵi]=0

Тоді і ви отримуєте(XXn)1(Xϵn)p0b^pβ

Якщо ви хочете, щоб центральна гранична теорема для застосування , то вам потрібно припущень про більш високих моментах, наприклад, , де . Центральна гранична теорема - це те, що дає вам асимптотичну нормальність і дозволяє говорити про стандартні помилки. Щоб другий момент існував, вам потрібні 4 моменти та . Ви хочете стверджувати, що кудиE[gigi]gi=xiϵib^E[gigi]xϵn(1nixiϵi)dN(0,Σ)Σ=E[xixiϵi2] . Щоб це працювало, має бути кінцевим.Σ

Хороша дискусія (яка мотивується цей пост) дається в Хаяши економетрики . (Див. Також стор. 149 для 4-х моментів та оцінки матриці коваріації.)

Обговорення:

Ці вимоги до 4-х моментів, мабуть, є технічним, а не практичним. Ви, мабуть, не зіткнетеся з патологічними поширеннями, де це проблема в повсякденних даних? Це для більш поширених або інших припущень OLS, щоб зійти з ладу.

Інше питання, на яке, безсумнівно, відповіли в іншому місці Stackexchange, - це наскільки велика кількість вибірки вам потрібна для кінцевих зразків, щоб наблизитися до асимптотичних результатів. Існує певний сенс, в якому фантастичні люди, що виживають, призводять до повільної конвергенції. Наприклад, спробуйте оцінити середнє значення лонормального розподілу з дійсно високою дисперсією. Середня вибірка - це послідовний, неупереджений середній показник популяції, але в цьому випадку нормального випадку з безумним надлишком куртозу тощо.

Кінцеве проти нескінченного є надзвичайно важливою відмінністю в математиці. Це не проблема, з якою ви стикаєтесь у щоденній статистиці. Практичні проблеми більше в малій та великій категорії. Чи є дисперсія, куртоз тощо ... досить маленькою, щоб я міг досягти розумних оцінок, враховуючи розмір вибірки?

Патологічний приклад, коли оцінювач OLS є послідовним, але не асимптотично нормальним

Поміркуйте:

yi=bxi+ϵi
Де але з t-розподілу з двома ступенями свободи, таким чином . Оцінка OLS сходиться з ймовірністю до але вибірковий розподіл для оцінки OLS зазвичай не розподіляється. Нижче наводиться емпіричний розподіл для на основі 10000 моделювання регресії з 10000 спостереженнями.xiN(0,1)ϵiVar(ϵi)=bb^b^QQPlot для оцінювача (не переходить у розподілі до нормального)

Розподіл не є нормальним, хвости занадто важкі. Але якщо ви збільшите градуси свободи до 3, щоб другий момент , тоді застосовується центральна межа, і ви отримаєте: b^ϵiQQPlot для оцінювача (переходить у розподілі до нормального)

Код для його створення:

beta = [-4; 3.7];
n = 1e5;    
n_sim = 10000;    
for s=1:n_sim
    X = [ones(n, 1), randn(n, 1)];  
    u  = trnd(2,n,1) / 100;
    y = X * beta + u;

    b(:,s) = X \ y;
end
b = b';
qqplot(b(:,2));

1
Гарна відповідь. Але насправді залежить від контексту: Ви не збираєтеся стикатися з патологічними розподілами з неіснуючими четвертими моментами в повсякденних даних. Фінансові дані (рентабельність фінансових активів), як правило, настільки ж важкі, що не мають кінцевого четвертого моменту. Тож занепокоєння з приводу 4-го моменту там справді реально. (Ви, ймовірно, можете додати це як примірник для батьків у своїй заяві.) Також питання: у вашому прикладі чому приводить до асимптотичної нормальності, незважаючи на відсутність кінцевого четвертого моменту? t(3)
Річард Харді

1
@RichardHardy Вам потрібно де . Вам потрібен той 4-й момент щоб існувати, і - це в основному другий момент в коли некорельовано з . n(1nixiϵi)dN(0,Σ)Σ=E[xixiϵi2]ΣΣϵiϵi2xixi
Метью Ганн

6
  1. Це достатнє припущення, але не мінімальне [1]. OLS не є упередженим у цих умовах, він просто непослідовний. Асимптотичні властивості OLS руйнуються, коли може мати надзвичайно великий вплив та / або якщо ви можете отримати надзвичайно великі залишки. Ви, можливо, не стикалися з офіційною презентацією теореми про центральну межу Ліндеберга Феллера, але це те, на що вони звертаються тут з умовами четвертого моменту, і умова Ліндеберга говорить нам в основному те саме: немає точок впливу надмірного розміру, немає великих важелів перевищення балів [2].X

  2. Ці теоретичні підґрунтя статистики викликають велику плутанину, коли їх додають до практичних програм. Визначення чужорідного немає, це поняття інтуїтивне. Щоб зрозуміти це грубо, спостереження повинно бути точкою високого важеля або високою точкою впливу, наприклад, такою, для якої діагностика видалення (бета DF) дуже велика, або для якої відстань махаланобіса в прогнозах велика (в універсаріатній статистиці) це лише оцінка Z). Але повернемось до практичних питань: якщо я провожу випадкове опитування людей та їх домогосподарств, а серед 100 осіб 1 особа, яку я вибираю, є мільйонером, я найкраще здогадуюсь, що мільйонери представляють 1% населення . У лекції з біостатистів ці принципи обговорюються та підкреслюються, що будь-який діагностичний інструмент є по суті досліджувальним [3].не "аналіз, який виключає чужий, - це той, в кого я вірю", це "вилучення однієї точки повністю змінив мій аналіз".

  3. Куртоз - це масштабована величина, яка залежить від другого моменту розподілу, але припущення про кінцеву ненульову дисперсію для цих значень є мовчазною, оскільки неможливо утримувати цю властивість у четвертому моменті, але не у другому. Так що в основному так, але в цілому я ніколи не перевіряв ні куртоз, ні четвертий момент. Я не вважаю їх практичним чи інтуїтивним заходом. У цей день, коли гістограма або розсіяний сюжет виробляється при натисканні пальцями, нам потрібно використовувати якісну графічну діагностичну статистику, перевіряючи ці ділянки.

[1] /math/79773/how-does-one-prove-that-lindeberg-condition-is-satisfied

[2] http://projecteuclid.org/download/pdf_1/euclid.ss/1177013818

[3] http://facturing.washington.edu/semerson/b517_2012/b517L03-2012-10-03/b517L03-2012-10-03.html


Як уже зазначалося раніше, інтуїція людей, що випадають, руйнується, коли їх є більше. Вони не обов'язково виділяються у бета-графіці DF або мають великі z-бали, оскільки самі ці статистичні дані можуть коливатися на сторонніх людей. Як ми вже обговорювали раніше, люди , які залишаються без перевірки, створюватимуть упереджені коефіцієнти, якщо ви не видалите їх або не використовуєте надійну техніку оцінки.
user603

1
Думаю, загалом, висловлюючи думки, ваші відповіді отримали б, включивши покажчики до відповідної літератури, щоб ОП знала, яку з цих думок широко застосовують.
user603

@ user603 На ваш перший коментар я не вказав DFbetas (або будь-який інструмент діагностики) як ексклюзивний метод ідентифікації людей, що живуть, але, безумовно, корисний. Виконуючи напівпараметричні умовиводи (середня коректна модель), люди, які не мають параметри, НЕ зміщують моделі LS. Чи можете ви створити посилання або навіть приклад у будь-якому випадку, крім непараметричного LS? Ваш другий коментар є хорошим, і я візьму наступні хвилини, щоб подати цитати.
AdamO

Твоє твердження, що "OLS не є упередженим у цих умовах, воно просто непослідовне", невірно. Вищі моменти потрібні для асимптотичної нормальності. Вони не потрібні для узгодженості зразків IID, де застосовується Закон Колмогорова про великі числа.
Меттью Ганн
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.