Завжди повідомляти про грубі (білі) стандартні помилки?


20

Ангріст і Пішке запропонували сказати, що про надійні (тобто стійкі до гетеросклестичності або неоднакові відмінності) стандартні помилки повідомляються як звичайно, а не для перевірки на них. Два питання:

  1. Що впливає на стандартні помилки при цьому, коли є гомоскедастичність?
  2. Хтось насправді це робить у своїй роботі?

Я не впевнений у тому, що ви мали на увазі під "звичайними стандартними помилками, як звичайно," стандартними помилками чого? Ви сказали тестування на "це", що таке тест, про який ви говорите?
Робін Жирард

1
Хороший момент .... Я говорю про стандартні помилки коефіцієнтів регресії в регресії OLS та про проблему гетероскедастичності. Традиційним підходом було б перевірити наявність гетероседастичності, використовуючи, наприклад, тест Уайта чи тест Брейша Язичника. Якщо виявлено гетероцедастичність, то можна повідомити про грубі стандартні помилки, як правило, про стандартні помилки білого кольору.
Грехем Куксон

Ви поклали б посилання на Анґріст і Пішке.
csgillespie

1
Ангріст, Джошуа Д. та Йорн-Стеффен Пішке. 2009. Здебільшого нешкідливі економетрики: супутник емпіриків. Прінстонська університетська преса: Прінстон, Нью-Джерсі.
Чарлі

Відповіді:


10

Використання надійних стандартних помилок стало звичною практикою в економіці. Надійні стандартні помилки, як правило, більше, ніж непостійні (стандартні?) Стандартні помилки, тому практика може розглядатися як намагання бути консервативними.

У великих зразках ( наприклад, якщо ви працюєте з даними перепису населення з мільйонами спостережень або наборами даних з "просто" тисячами спостережень), тести на гетерокедастичність майже напевно виявляться позитивними, тому такий підхід є відповідним.

Іншим засобом для боротьби з гетерокедастичністю є зважені найменші квадрати, але цей підхід став оглянутий, оскільки він змінює оцінки параметрів, на відміну від використання надійних стандартних помилок. Якщо ваги невірні, ваші оцінки упереджені. Якщо ваги важні, проте, ви отримуєте менші ("ефективніші") стандартні помилки, ніж OLS з надійними стандартними помилками.


1
Наскільки ширші надійні стандартні помилки, ніж звичайні стандартні помилки, коли припущення OLS не порушуються?
russellpierce

1
Не завжди ширше взагалі - адже вони іноді можуть бути вужчими. Див останнього повідомлення в блозі для книги Angrist & пішком в: mostlyharmlesseconometrics.com/2010/12 / ...
OneStop

1
+1, з коментарем @ onestop в коментарі вище, що надійний se може дуже бути більшим або меншим, хоча, як правило, ми очікуємо, що вони будуть більшими і, таким чином, "консервативними" wrt помилками типу I. І так, я завжди використовую в своїй роботі гетерокедастичний надійний або кластерний, як і всі, кого я знаю.
Cyrus S

1
Тести на гетероскедастичність, які не виявляються значними, не є причиною перестати турбуватися про те, що гетерокедастичність зіпсує ваш OLS - цей тест може не мати великої потужності, навіть якщо ефект є.
гість

1
Хороша причина, щоб не пробувати WLS, полягає в тому, що дуже часто ви не маєте уявлення про те, що справжня співвідношення середньої дисперсії - і зазирнути до обраних даних може призвести до недійсності ваших висновків про вільну діяльність. Як і Сайрус, я в усьому світі використовую надійні се.
гість

6

У Вступній економетрії (Woolridge, 2009 р., Видання, сторінка 268) це питання вирішено. Вулрідж говорить, що при використанні надійних стандартних помилок отримані t-статистики мають лише розподіли, подібні до точних t-розподілів, якщо розмір вибірки великий. Якщо розмір вибірки невеликий, t-статистика, отримана за допомогою надійної регресії, може мати розподіли, не близькі до розподілу t, і це може скинути умовивід.


6

Надійні стандартні помилки забезпечують неупереджені стандартні оцінки помилок при гетероседастичності. Існує декілька статистичних підручників, які пропонують велику та тривалу дискусію щодо надійних стандартних помилок. На наступному веб-сайті представлено дещо вичерпний підсумок про надійні стандартні помилки:

https://economictheoryblog.com/2016/08/07/robust-standard-errors/

Повертаємось до своїх питань. Використання надійних стандартних помилок не обходиться із застереженнями. Згідно Woolridge (видання 2009 р., Стор. 268), використовуючи надійні стандартні помилки, отримані t-статистики мають лише розподіли, схожі на точні t-розподіли, якщо розмір вибірки великий. Якщо розмір вибірки невеликий, t-статистика, отримана за допомогою надійної регресії, може мати розподіли, не близькі до розподілу t. Це може скинути умовивід. Крім того, у випадку гомоскедастичності надійні стандартні помилки залишаються неупередженими. Однак вони неефективні. Тобто звичайні стандартні помилки є більш точними, ніж надійні стандартні помилки. Нарешті, використання надійних стандартних помилок є звичайною практикою у багатьох наукових сферах.


5

Існує маса причин уникати використання надійних стандартних помилок. Технічно те, що відбувається, полягає в тому, що відхилення отримують зваженими вагами, які ви не можете довести в реальності. Таким чином, грубість - просто косметичний засіб. Взагалі слід задуматися про зміну моделі. Існує багато наслідків, щоб краще вирішити проблему гетерогенності, ніж просто вирішити проблему, що виникає з ваших даних. Прийміть це як знак для перемикання моделі. Питання тісно пов’язане з питанням, як поводитися з випускниками. SOme люди просто видаляють їх, щоб отримати кращі результати, це майже те саме, коли використовується надійні стандартні помилки, просто в іншому контексті.


Це дійсно погана порада. Завжди використовуйте надійні помилки, оскільки вони узгоджуються в будь-якому випадку
Repmat

3

Я думав, що Помилка білого стандарту та Стандартна помилка, обчислена "нормальним" способом (наприклад, Гессіан та / або ОПГ у випадку максимальної ймовірності), були асимптотично еквівалентними у випадку гомоскдастичності?

Тільки за наявності гетерокедастичності "нормальна" стандартна помилка буде невідповідною, а це означає, що Біла стандартна помилка є доречною з гетерокедастичністю або без неї, тобто навіть тоді, коли ваша модель є гомоскедастичною.

Я не можу реально говорити про 2, але не бачу, чому не хотілося б обчислити Білий СВ і включити його в результати.


2

У мене є підручник під назвою Вступ до економетрії, 3-е видання. by Stock and Watson, який читає, "якщо помилки гетерокедастичні, то t-статистика, обчислена за допомогою стандартної помилки, гомосекедастичності, не має стандартного нормального розподілу навіть у великих вибірках". Я вважаю, що ви не можете зробити належну перевірку висновків / гіпотез, не маючи змоги припустити, що ваша t-статистика поширюється як звичайна норма. Я маю багато поваги до Вулдріджа (насправді мій клас випускника також використав його книгу), тому я вважаю, що те, що він говорить про статистику T, використовуючи надійні SE, вимагає, щоб великі зразки були відповідними, безумовно, правильно, але я думаю, що ми часто доводиться стикатися з вимогою великого зразка, і ми це приймаємо. Однак той факт, що використання неміцних SE не дасть t-stat при належному стандартному нормальному розподілінавіть якщо у вас є великий зразок, це набагато більший виклик для подолання.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.