Інтуїція індексу оцінювача сендвіч


20

Вікіпедія та віньєтка із сендвіч-пакету R надають хорошу інформацію про припущення, що підтримують стандартні помилки коефіцієнта OLS та математичну основу сендвіч-оцінювачів. Мені все ще не зрозуміло, як вирішується проблема гетероседастичності залишків, мабуть, тому, що я не розумію в першу чергу стандартну оцінку дисперсії коефіцієнтів OLS.

Яка інтуїція стоїть за сендвіч-оцінкою?


5
Вам потрібно дізнатися більше про оцінку (або оцінку екстремуму, як це іноді називають в економетриці). Оцінювач сендвіч для регресії - це лише окремий випадок дуже загальної формули дельта-методу, і якщо ви розумієте останню, у вас не виникне жодних проблем з першою. Немає інтуїції в тому, що сендвіч-оцінювач не намагається моделювати гетероскедастичність або робити щось конкретне щодо цього; це просто інший оцінювач дисперсії, який працює за більш загальним набором припущень, ніж стандартний OLS-оцінювач. M
Стаск

@StasK Дякую! Чи знаєте ви якийсь хороший ресурс за формулами М-оцінки та дельта-методом?
Роберт Кубрик

Монографію @ Rober Huber «Надійна статистика» варто переглянути.
Момо

Відповіді:


17

Для OLS можна уявити, що ви використовуєте оцінену дисперсію залишків (за умови незалежності та гомоскедастичності) як оцінку для умовної дисперсії s. У сендвіч-обчислювачі ви використовуєте спостережувані залишки квадрата як оцінку плагіну тієї самої дисперсії, яка може змінюватись в різних спостереженнях.Yi

var(β^)=(XTX)1(XTdiag(var(Y|X))X)(XTX)1

У стандартній оцінці помилок звичайних найменших квадратів для оцінки коефіцієнта регресії умовна дисперсія результату трактується як постійна і незалежна, так що її можна оцінювати послідовно.

var^OLS(β^)=(XTX)1(r2XTX)(XTX)1

Для сендвіч ми знімаємо послідовну оцінку умовної дисперсії і замість цього використовуємо модуль оцінки дисперсії кожного компонента за допомогою залишкового квадрата.

var^RSE(β^)=(XTX)1(XTdiag(ri2)X)(XTX)1

Використовуючи оцінку дисперсії плагіна, ми отримуємо послідовні оцінки дисперсії за теоремою центрального ліміту Ляпунова.β^

Інтуїтивно ці спостережувані залишки в квадраті будуть прибирати будь-яку незрозумілу помилку через гетероседастичність, яка в іншому випадку була б несподіваною при допущенні постійної дисперсії.


Це ваш останній абзац, який мені важко зрозуміти. Чи можете ви проілюструвати?
Роберт Кубрик

Це не SE у ваших формулах, AdamO, це SE ^ 2 ... будь-яким матричним способом ви це маєте на увазі.
Стаск

@StasK Добре. Можливо, варіація-капелюх краще. Мене плутала багатоваріантна та універсарна термінологія.
AdamO

1
@RobertKubrick В останньому абзаці я вказую, що ключова відмінність оцінювачів полягає в тому, як ми представляємо умовний дисперсійний термін . У моделі лінійної регресії ми послідовно оцінюємо залишки, але за допомогою сендвіча ми просто використовуємо підключення оцінки умовної дисперсії для -го терміна з використанням залишків у квадраті. За наявності гетероседастичності точки з відносно великими залишками у квадраті мають відповідну велику оціночну дисперсію, і це зменшує їх вплив на стандартні оцінки помилок. ivar(Y|X)i
AdamO

Редагувати: Я сказав, що оцінки OLS var включають "послідовні оцінки залишків", коли я мав на увазі "послідовну оцінку дисперсії залишків".
AdamO
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.