Чому можна регресувати часові ряди?


14

Це взагалі може бути дивним питанням, але мені, як новачку до теми, цікаво, чому ми використовуємо регресію для зменшення часового ряду, якщо одне з припущень регресії - це дані, які мають ідентифікуватися, тоді як дані, щодо яких застосовується регресія, - це non iid?


6
Загалом не вірно, що ми робимо припущення, що "дані" є
ідієм

3
Що саме ви маєте на увазі під дрендом ?
Меттью Ганн

6
У мене немає часу написати відповідну відповідь / документ, але, як правило, послідовне співвідношення не зміщує результати лінійної регресії (це змінює відповідні обчислення стандартних помилок, довірчих інтервалів тощо). Це робить класичний двоступеневий підхід (детренд, а потім аналіз на кореляцію) розумним. (наприклад, деяке гуглювання "неупередженої лінійної регресії послідовних кореляцій призводить до fmwww.bc.edu/ec-c/f2010/228/EC228.f2010.nn12.pdf )
Бен Болкер

2
Можливо , ще важливіше те , що МНК - оцінка коефіцієнта за лінійним тренду сходиться цілий порядок швидше (при швидкості ) до його істинного значення , ніж для стаціонарних регресорів ( п - 1 / 2 ), що означає можна послідовно оцінювати тенденцію, навіть якщо нехтувати стаціонарними змінними. Це на відміну від оцінки ефектів стаціонарних змінних по черзі, де ви втрачаєте послідовність, якщо опускаєте змінні. н-3/2н-1/2
Річард Харді

Відповіді:


15

Ви проникливі в розумінні того, що може виникнути конфлікт між класичними припущеннями звичайної лінійної регресії найменших квадратів та послідовною залежністю, яка зазвичай зустрічається в налаштуваннях часових рядів.

Розглянемо припущення 1.2 (сувора екзогенність) економетрики Фуміо Хаяші .

E[ϵiX]=0

Це в свою чергу означає, що , що будь-який залишок resid i є ортогональним для будь-якого регресора x j . Як зазначає Хаяші, це припущення порушено в найпростішій авторегресивній моделі . [1] Розглянемо процес AR (1):E[ϵixj]=0ϵixj

yt=βyt1+ϵt

ytyt+1ϵtytE[ϵtyt]0

Оскільки суворе припущення про екзогенність порушено, жоден аргумент, який спирається на це припущення, не може бути застосований до цієї простої моделі AR (1)!

Отже, у нас є нерозв'язна проблема?

Ні, ми ні! Оцінка моделей AR (1) із звичайними найменшими квадратами цілком справедлива, стандартна поведінка. Чому це все ще може бути нормально?

Великий вибірковий, асимптотичний аргументи не потребують суворої екзогенності. Достатньою припущенням (яке можна використовувати замість суворої екзогенності) є те, що регресори визначені заздалегідь , що регресори є ортогональними для сучасного терміна помилки. Повний аргумент див. У главі 2 Хаяші.

Список літератури

[1] Фуміо Хаяші, економетрика (2000), с. 35

[2] там же, с. 134


6

Основні методи регресії типу найменших квадратів не припускають, що значення y є iid. Вони припускають, що залишки (тобто y-значення мінус справжній тренд) є iid

Існують інші методи регресії, які дають різні припущення, але це, мабуть, надто ускладнює цю відповідь.


5
Припущення, яке також явно помилкове: просто подумайте про часові ряди як з лінійною тенденцією, так і з сезонністю. Решта залишків від лінійної регресії чітко співвідносяться, таким чином, не є iid.
DeltaIV

3

Це гарне запитання! Про мою книгу про часові ряди ця тема навіть не згадується (мені, мабуть, потрібні кращі книги :) Перш за все, зауважте, що ви не змушені використовувати лінійну регресію, щоб зменшити часовий ряд, якщо серія має стохастичну тенденцію (одиничний корінь )- ви могли просто взяти першу різницю. Але вам доведеться використовувати лінійну регресію, якщо серія має детерміновану тенденцію. У цьому випадку це правда, що залишки не є ідентичними, як ви кажете. Подумайте лише про серію, яка має лінійну тенденцію, сезонні компоненти, циклічні компоненти тощо. Всі разом - після лінійної регресії залишки залишаються незалежними. Справа в тому, що ви не використовуєте лінійну регресію для прогнозування або для формування інтервалів прогнозування. Це лише частина вашої процедури для висновку: вам все-таки потрібно застосувати інші методи, щоб дістатись до некорельованих залишків. Отже, в той час як лінійна регресія сама по собі не є дійсною процедурою висновку (це не правильна статистична модель) для більшості часових рядів, процедура, яка включає лінійну регресію в якості одного з її кроків, може бути дійсною моделлю, якщо модель, яку вона передбачає, відповідає процесу генерації даних для часовий ряд.


3
Не розрізняйте, якщо у вас детермінований тренд - диференціація підходить лише для стохастичних тенденцій (одиничні корені). Якщо ви розмежуєте серію без одиничного кореня, ви введете інтегрований середній тип помилок у моделі, і це неприємно.
Річард Харді

1
Я думаю, ти маєш на увазі різницю, а не диференціювання.
Hong Ooi

@RichardHardy цікаво. Що ви маєте на увазі під "стохастичним трендом"? Ви маєте на увазі цикли? Бут=β0+β1ут-1+ϵтмаєте стохастичний чи детермінований тренд відповідно до вашого визначення?
DeltaIV

1
@HongOoi, так, мій поганий, я мав на увазі диференціювання, а не диференціацію. Як сказано в DeltaIV, часовий ряд має стохастичну тенденцію, якщо часовий ряд є інтегрованим (= одиничним коренем) процесом. Це стандартний термін в одиничній літературі та коінтеграційній літературі. Цікаво, чи воно має різні значення в інших напрямках літератури. У будь-якому випадку, переоцінка (= розмежування часового ряду, що не має одиничного кореня), є горезвісним явищем, і цього слід уникати.
Річард Харді

@RichardHardy добре, спасибі Я спробую документувати себе про визначення інтегрованих коренів процесу та одиниць. Для початку ви можете сказати мені, чи запропонована мною серія інтегрована чи ні? Коріння, на які ви посилаєтесь, коріння многочленау=β0+бета1х1?
DeltaIV
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.