vcovHC, vcovHAC, NeweyWest - яку функцію використовувати?


10

Я намагаюся оновити свою модель на основі lm (), щоб отримати правильні стандартні помилки та тести. Я дуже розгублений, яку матрицю VC використовувати. У sandwichпакет пропозицій vcovHC, vcovHACі NeweyWest. У той час як перший припадає лише на гетероскедастичність, останні два пояснюють як послідовну кореляцію, так і гетерокедастичність. Тим не менш, документація не дуже розповідає про різницю між двома останніми (принаймні, я не розумію). Переглядаючи саму функцію, я зрозумів, що NeweyWest насправді викликає vcovHAC.

Емпірично результати coeftest(mymodel, vcov. = vcovHAC)та coeftest(mymodel, vcov. = NeweyWest)божевільні різні. Хоча vcovHACдещо наближений до результатів наївного lm, за допомогою NeweyWest всі коефіцієнти виявляються незначними (тести навіть близькі до 1).


Зазвичай R довідкові сторінки дають посилання на статті. Там точно містяться точні деталі. Наприклад, стаття Zeileis є у вільному доступі і містить безліч інформації.
mpiktas

2
У статті Zeileis конкретно зазначено, vcovHACчим відрізняється від NeweyWest. Підводячи підсумок, різні методи HAC відрізняються лише за вибором ваги. NeweyWestмає визначені ваги, vcovHACє загальною функцією, яка дозволяє вам поставляти власні ваги, а за замовчуванням використовує ваги Ендрюса.
mpiktas

@mpiktas: thx для резюме. Оскільки я не вказав жодних ваг, слід використовувати відповідні ваги за замовчуванням. Тепер, коли я знаю, я, можливо, можу повторно поставити своє запитання на те: Чому різні ваги vcovHAC та NeweyWest за замовчуванням мають таке велике значення і як визначити вагу? Я знаю, чи знаєте ви, які ваги використовуються STATA або інші пакети?
hans0l0

всі ці обчислення залежать від того, що є стаціонарними змінними, де є регресорами, а - порушеннями. Стаціонарність є дещо обмежувальною властивістю, тому перевірте, чи є вона. хтутхтут
mpiktas

Відповіді:


3

"Сендвіч", про який йде мова, - це два шматки хліба, визначені очікуваною інформацією, що додає м'ясо, визначеною спостережуваною інформацією. Дивіться мої коментарі тут і тут . Для лінійної регресії оціночним рівнянням є:

U(β)=ХТ(Y-ХТβ)

Очікувана інформація (хліб):

А=U(β)β=-(ХТХ)

Інформація, що спостерігається (м'ясо):

Б=Е(U(β)U(β)Т)=ХТ(Y-ХТβ)(Y-ХТβ)ТХ

Зауважимо, що внутрішній термін - це діагональ постійних залишків, коли дотримується гомоскедастичність, незалежне припущення даних, тоді оцінювач сендвіч-коваріації, який задається є звичайною лінійною матрицею коваріації регресії де - дисперсія залишків. Однак це досить суворо. Ви отримуєте значно ширший клас оцінювачів, послабивши припущення, пов'язані з залишковою матрицею : .А-1БА-1σ2(ХТХ)-1σ2н×н

R=(Y-ХТβ)(Y-ХТβ)

Оцінювач "HC0" vcovHCє послідовним навіть тоді, коли дані не є незалежними. Тому я не скажу, що ми «вважаємо» залишки незалежними, але скажу, що ми використовуємо «працюючу незалежну структуру коваріації». Тоді матриця замінюється діагоналлю залишківR

Rii=(Yi-βХЯ.)2,0 в іншому місці

Цей оцінювач працює дуже добре, за винятком невеликих зразків (<40 часто заявляється). HC1-3 - це різні корекції вибірок. HC3, як правило, найкраще працює.

Однак якщо є авторегресивні ефекти, позадіагональні записи є ненульовими, тому масштабована матриця коваріації виробляється на основі часто використовуваних авторегресивних структур. Це є обґрунтуванням "vcovHAC". Тут розробляються дуже гнучкі та загальні методи для оцінки автоматичного ефекту: деталі можуть виходити за рамки вашого питання. Функція "meatHAC" є загальним робочим конем: методом за замовчуванням є Ендрюс. Newey-West - це окремий випадок загального оцінювача авторегресивних помилок. Ці методи вирішують одну з двох проблем: 1. з якою швидкістю відбувається розпад кореляції між "сусідніми" спостереженнями та 2. яка розумна відстань між двома спостереженнями? Ці Якщо ви збалансовані дані панелі, цей коефіцієнт коваріації є надмірним.Тgeegeeпакет замість того, щоб вказати структуру коваріації до AR-1подібного або подібного.

Щодо використання, це залежить від характеру аналізу даних та наукового питання. Я б не радив підходити до всіх типів і підбирати той, який найкраще виглядає, оскільки це кілька питань тестування. Як я вже нагадав раніше, оцінювач vcovHC є послідовним навіть за наявності авторегресивного ефекту, тому ви можете використовувати та обґрунтовувати "модель кореляції незалежності робочої сили" за різних обставин.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.