Чи точно визначені 2SLS-медіа-неупереджені?


13

У Здебільшого безшкодній економетрії: Супутник емпіриків (Ангріст і Пішке, 2009: стор. 209) я прочитав наступне:

(...) Насправді, щойно визначений 2SLS (скажімо, простий Оцінювач Вальда) є приблизно неупередженим . Це важко показати формально, оскільки щойно визначений 2SLS не має моментів (тобто розподіл вибірки має жирові хвости). Тим не менш, навіть із слабкими інструментами, щойно визначений 2SLS приблизно орієнтований там, де він повинен бути. Тому ми кажемо, що щойно визначений 2SLS є середньо-неупередженим. (...)

Хоча автори стверджують, що щойно визначені 2SLS є медіа-неупередженими, вони ні доводять, ні надають посилання на доказ . На сторінці 213 вони знову згадують пропозицію, але не посилаючись на доказ. Крім того, я не можу знайти мотивацію пропозиції в їхніх лекційних записках щодо інструментальних змінних з MIT , стор. 22.

Причиною може бути те, що пропозиція помилкова, оскільки вони відкидають її у примітці до свого блогу . Однак, щойно визначені 2SLS є приблизно середньо-неупередженими, пишуть вони. Вони мотивують це за допомогою невеликого експерименту Монте-Карло, але не надають аналітичного доказу чи вираження закритої форми помилки, пов'язаного з наближенням. Так чи інакше, це була відповідь авторів професора Гері Солона з Мічиганського державного університету, який зробив зауваження, що щойно визначена 2SLS не є медіа-неупередженою.

Питання 1: Як довести, що щойно визначена 2SLS не є медіа-неупередженою, як стверджує Гері Солон?

Питання 2: Як довести, що щойно визначений 2SLS є приблизно посередньо-неупередженим, як стверджують Ангріс та Пішке?

Для питання 1 я шукаю контрприклад. Для питання 2 я (в першу чергу) шукаю доказ чи посилання на доказ.

Я також шукаю формальне визначення медіан-неупередженого в цьому контексті. Я розумію поняття так: Оцінювач з заснований на деякому наборі з випадкових величин, є медіа-неупередженим для якщо і тільки якщо розподіл має медіану .thetasХ1:ппthetas ; & thetas ; (Х1:п)thetasθ^(X1:n)θX1:nnθθ^(X1:n)θ


Примітки

  1. У щойно визначеній моделі кількість ендогенних регресорів дорівнює кількості інструментів.

  2. Рамка, що описує щойно ідентифіковану модель інструментальних змінних, може бути виражена наступним чином: Причинно-наслідкова модель інтересу та рівняння на першому етапі є , де являє собою матриця , що описує ендогенні регресорів, і де інструментальних змінних описується матриця . Тут просто описує деяку кількість змінних керування (наприклад, додано для підвищення точності); і і - терміни помилки. Xk×n+1kk×n+1ZWuv

    (1){Y=Xβ+Wγ+uX=Zδ+Wζ+v
    Xk×n+1kk×n+1ZWuv
  3. Ми оцінюємо в за допомогою 2SLS: По-перше, регресуємо на контролі для і отримуємо прогнозовані значення ; це називається першим етапом. По-друге, регресуйте на контролюючи ; це називається другим етапом. Орієнтовний коефіцієнт на на другому етапі - це наша 2SLS оцінка .( 1 ) Х Z Ш Х У Й Ш Х ββ(1)XZWX^YX^WX^β

  4. У найпростішому випадку ми маємо модель та інструментуємо ендогенний регресор з . У цьому випадку оцінка 2SLS є де позначає зразок ковариации між і . Ми можемо спростити : де , тах я г я & beta ; & beta ; 2SLS = s Z Y

    yi=α+βxi+ui
    xiziβївABAB(2) β 2SLS=Σя(уя- ˉ у )гя
    (2)β^2SLS=sZYsZX,
    sABAB(2) ˉy=iyi/nˉx=ixi/nˉu=iui/nn
    (3)β^2SLS=i(yiy¯)zii(xix¯)zi=β+i(uiu¯)zii(xix¯)zi
    y¯=iyi/nx¯=ixi/nu¯=iui/n, де - кількість спостережень.n
  5. Я здійснив пошук літератури, використовуючи слова "щойно визначені" та "медіа-неупереджені", щоб знайти посилання, що відповідають на питання 1 та 2 (див. Вище). Я не знайшов жодного. Усі статті, які я знайшов (див. Нижче), містять посилання на Angrist and Pischke (2009: стор. 209, 213), заявляючи, що щойно визначений 2SLS є медіа-неупередженим.

    • Jakiela, P., Miguel, E., & Te Velde, VL (2015). Ви заробили це: оцінка впливу людського капіталу на соціальні переваги. Експериментальна економіка , 18 (3), 385-407.
    • An, W. (2015). Оцінка інструментальних змінних оцінок рівних ефектів у соціальних мережах. Соціологічні дослідження , 50, 382-394.
    • Vermeulen, W., і Van Ommeren, J. (2009). Чи планує землекористування формує економіку регіону? Одночасний аналіз пропозиції житла, внутрішньої міграції та зростання місцевої зайнятості в Нідерландах. Журнал житлової економіки , 18 (4), 294-310.
    • Aidt, TS, & Leon, G. (2016). Демократичне вікно можливостей: свідчення про заворушення в країнах Південної Сахари. Журнал вирішення конфліктів , 60 (4), 694-717.

2
Я не міг відповісти на це формальним доказом, а скоріше за допомогою симуляційних досліджень, що показують, що LIML є середньою неупередженою (плюс визначення) і що LIML та 2SLS з однією ендогенною змінною та одним інструментом мають однаковий невеликий розподіл вибірки (отже, якщо LIML у цьому випадок є медіаном-неупередженим, тож 2SLS). Цього буде достатньо, щоб відповісти на ваше запитання?
Енді

@Andy Це була б дійсно гарна відповідь! Можливо, достатньо, залежно від того, що можуть сказати інші користувачі. Напевно, це достатньо, оскільки я думаю, що немає доказів того, що щойно визначена 2SLS є приблизно медіа-неупередженою. Було б непогано з контрприкладом, який показує, що щойно визначений 2SLS не є медіано-неупередженим; але я думаю, що можна (але, можливо, важко) самостійно придумати контрприклад.
Ілля

Приблизно неупереджено, ви маєте на увазі, що ухил переходить до нуля як деяка функція кількості спостережень, таких як 1 / n або 1 / n ^ 2 тощо?
Ігор

@Igor Фраза "приблизно посередньо-неупереджено" не використовується мною. Оскільки я не знаю, що формально "неупереджено" середньо, я не можу відповісти на ваше запитання. Але те, про що ви, здається, думаєте, - це оцінювач, який є асимптотично неупередженим.
Ілля

Відповіді:


6

У симуляційних дослідженнях термін медіанна зміщення означає абсолютне значення відхилень оцінювача від його справжнього значення (яке ви знаєте в цьому випадку, оскільки це симуляція, тож ви вибираєте справжнє значення). Ви можете побачити робочий документ Янга (2017), який визначає подібну медіану зміщення у таблиці 15, або Ендрюс та Армстронг (2016), які побудували графіки медіанного зміщення для різних оцінок на рисунку 2.

Частина плутанини (також в літературі), здається, випливає з того, що є дві основні проблеми:

  1. слабкі інструменти
  2. багато (потенційно) слабких інструментів

Проблема наявності слабкого інструменту в точно визначеній обстановці сильно відрізняється від наявності багатьох інструментів, де деякі слабкі, однак обидва питання іноді збираються разом.

κ

β^=[X(IκMZ)X]1[X(IκMZ)y)]

MZ=IZ(ZZ)1Z

y=Xβ+uX=Zπ+e.

κκ=0κ=1κdet(XXκXMZX))=0

Асимптотично, LIML та 2SLS мають однаковий розподіл, однак у малих зразках це може бути дуже різним. Особливо це стосується тих випадків, коли у нас багато інструментів і якщо деякі з них слабкі. У цьому випадку LIML працює краще, ніж 2SLS. Тут показано, що LIML є медіаном неупередженим. Цей результат виходить із ряду симуляційних досліджень. Зазвичай статті, в яких зазначається цей результат, посилаються на Ротберга (1983) "Асимптотичні властивості деяких оцінювачів в структурних моделях", Sawa (1972) або Anderson et al. (1982) .

Стів Пішке забезпечує моделювання цього результату у своїх нотатках про 2016 на слайді 17, показуючи розповсюдження OLS, LIML та 2SLS з 20 інструментами, з яких лише один насправді корисний. Справжнє значення коефіцієнта дорівнює 1. Ви бачите, що LIML орієнтоване на справжнє значення, тоді як 2SLS є упередженим у напрямку OLS. введіть тут опис зображення

Тепер аргумент здається таким: враховуючи, що LIML може бути показаний як медіанна неупереджена і що у щойно визначеному випадку (одна ендогенна змінна, один інструмент) LIML та 2SLS є рівнозначними, 2SLS також повинен бути медіаном неупередженим.

Однак, схоже, що люди знову змішують "слабкий інструмент" та "безліч слабких інструментів", тому що в щойно визначеній обстановці і LIML, і 2SLS будуть упереджені, коли інструмент слабкий. Я не бачив жодного результату, де було б продемонстровано, що LIML є неупередженим у щойно визначеному випадку, коли інструмент слабкий, і я не думаю, що це правда. Аналогічний висновок виходить з Angrist і Pischke років (2009) відповіді Гарі Соло на сторінці 2 , де вони імітують зміщення МНКАА, 2МНК і LIML при зміні сили приладу. введіть тут опис зображення

Для дуже малих коефіцієнтів першого ступеня <0,1 (утримує фіксовану стандартну помилку), тобто низька міцність приладу, щойно ідентифікована 2SLS (а значить, ідентифікована LIML) набагато ближче до межі ймовірності оцінювача OLS істинне значення коефіцієнта 1.

Після того, як коефіцієнт першого етапу становить від 0,1 до 0,2, вони зазначають, що статистика F на першому етапі вище 10, а отже, більше немає слабкої проблеми з інструментом відповідно до правила великого F> 10 від Stock and Yogo (2005). У цьому сенсі я не бачу, як LIML повинен бути виправленням слабкої проблеми з інструментом у щойно визначеному випадку. Також зауважте, що i) LIML має тенденцію до більшого розповсюдження і вимагає виправлення стандартних помилок (див. Bekker, 1994) та ii) якщо ваш інструмент насправді слабкий, на другій стадії ви нічого не знайдете, ні з 2SLS, ні LIML тому що стандартні помилки будуть просто занадто великими.


Дякую за відповідь! Це зробило для мене все набагато зрозумілішим.
Ілля
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.