Коли необхідно включити відставання залежної змінної у регресійну модель і яке відставання?


14

Дані, які ми хочемо використовувати як залежну змінну, виглядають так (це дані про кількість). Ми побоюємось, що оскільки вона має циклічну складову та структуру тенденцій, регресія виявляється якось упередженою.

введіть тут опис зображення

Ми будемо використовувати негативну біноміальну регресію, якщо це допоможе. Дані - це збалансована панель, одна манекен на кожного (штати). На зображеному зображенні відображається сума залежної змінної для всіх станів, однак у більшості станів однакова поведінка. Ми розглядаємо модель фіксованих ефектів. Залежні змінні не дуже сильно співвіднесені, частина дослідження полягає у пошуку несподіваного відношення серед цих змінних, тому слабке відношення насправді є чимось хорошим.

  1. Які точні небезпеки не включають змінну відставання залежної змінної?
  2. Якщо потрібно включити один, чи є тест, щоб знати, який (и).

Реалізація проводиться в Р.

Примітка : я читав цей пост, але це не допомогло нашій проблемі.

Відповіді:


14

Динамічна модель панелі може мати сенс, якщо у вас є модель відплати «очей за око» для вбивств. Наприклад, якщо рівень вбивств в значній мірі визначався ворожнечами банди, то вбивства в момент часу могли б бути функцією загиблих при t - 1 або інших відставаннях. tt1

Я буду відповідати на ваші запитання не в порядку. Припустимо, DGP є

yit=δyit1+xitβ+μi+vit,

де помилки і v не залежать один від одного і між собою. Вам цікаво провести тест, чи δ = 0 (питання 2).μvδ=0

Якщо ви використовуєте OLS, легко помітити, що і перша частина помилки співвідносяться, що робить OLS упередженою та непослідовною, навіть коли в v немає серійної кореляції . Нам потрібно щось складніше зробити тест.yit1v

Наступне, що ви можете спробувати - це оцінювач фіксованих ефектів із внутрішньою трансформацією, де ви перетворюєте дані, віднімаючи середнє значення кожної одиниці , ˉ y i , від кожного спостереження. Це знищує μ , але цей оцінювач страждає від зміщення Нікелла , який зміщення не зникає, оскільки кількість спостережень N зростає, тому він є непостійним для великих N та малих Т- панелей. Однак у міру зростання Т ви отримуєте консистенцію δ і β . Джудсон та Оуен (1999) роблять деякі симуляції з N = 20 ,yy¯iμNNTTδβ і Т = 5 , 10 , 20 , 30 і виявили зсув, збільшується в б і зменшення в Т . Однак навіть для T = 30 зміщення може становити до 20 % від істинного значення коефіцієнта. Це погані новини! Отже, залежно від розмірів панелі, можливо, ви захочете уникнути оцінки FE. Якщо δ > 0 , ухил негативний, тому стійкість y занижена. Якщо регресори співвідносяться з відставанням, β також буде упередженим.N=20,100T=5,10,20,30δTT=3020%δ>0yβ

yit2Δyit1=yit1yit2xitxit1Xvy

Ареллано та Бонд (1991) отримують більш ефективний узагальнений метод оцінювання моментів (GMM), який був розширений з того часу, послаблюючи деякі припущення. Розділ 8 на панельній книзі Балтагі є хорошим опитуванням цієї літератури, хоча, наскільки я можу сказати, вона не стосується вибору відставання. Це найсучасніші метрики, але більш технічно вимогливі.

Я думаю, що в plmпакеті R є деякі з цих вбудованих. Динамічні моделі панелей є у Stata з версії 10 , а SAS має принаймні версію GMM . Жодна з них не є моделями даних для підрахунку, але це може не бути великою справою залежно від ваших даних. Однак ось один приклад динамічної моделі панелі Пуассона GMM в Stata.

yβ


Отже, ви використовуєте рівні як інструмент, коли у вас є розрізнені серії, а відмінності, коли у вас є серія в рівнях ?
Енді Ш

iΔyt2=yt2yt3yt2Δyt1=yt1yt2
Мастеров Дмитро Васильович
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.