Що робити пояснень у часових рядах?


11

Працюючи в основному з даними поперечного перерізу і зовсім недавно переглядаючи, скануючи спотикання через купу вступної літератури часових рядів, мені цікаво, яку роль відіграють пояснювальні змінні в аналізі часових рядів.

Я б хотів пояснити тенденцію, а не дерендувати. Більшість того, що я читаю як вступ, передбачає, що серія випливає з якогось стохастичного процесу. Я читав про процеси AR (p) та MA, а також про моделювання ARIMA. Бажаючи розібратися з більшою кількістю інформації, ніж лише авторегресивними процесами, я знайшов VAR / VECM і провів декілька прикладів, але все одно мені цікаво, чи є якийсь випадок, пов’язаний ближче до того, що пояснення роблять у перерізах.

Мотивація цього полягає в тому, що декомпозиція моєї серії показує, що тенденція є головним фактором, а залишок та сезонний ефект навряд чи грають роль. Я хотів би пояснити цю тенденцію.

Чи можу / я повинен регресувати свою серію у кількох різних серіях? Я б інтуїтивно використовував gls через послідовну кореляцію (я не дуже впевнений у структурі кор). Я чув про помилкову регресію і розумію, що це підводний камінь, але я шукаю спосіб пояснити тенденцію.

Це абсолютно неправильно чи нечасто? Або я щойно пропустив правильний розділ?

Відповіді:


15

Спираючись на коментарі, які ви запропонували до відповідей, вам слід знати про помилкову причину . Будь-яка змінна з часовою тенденцією буде корелювати з іншою змінною, яка також має тенденцію часу. Наприклад, моя вага від народження до 27 років буде сильно співвідноситися з вашою вагою від народження до 27 років. Очевидно, що моя вага не обумовлена вашою вагою. Якби це було, я б просив, щоб ви ходили частіше в спортзал, будь ласка.

Оскільки ви знайомі з даними поперечного перерізу, я дам вам пояснення пропущених змінних. Нехай моя вагаxt і ваша вага бути yt, де

xt=α0+α1t+ϵt andyt=β0+β1t+ηt.

Потім регресія

yt=γ0+γ1xt+νt
має пропущену змінну --- тенденцію часу ---, яка співвідноситься з включеною змінною, xt. Отже, коефіцієнтγ1 буде упередженим (у цьому випадку це буде позитивним, оскільки наші ваги з часом зростають).

Виконуючи аналіз часових рядів, ви повинні бути впевнені, що ваші змінні нерухомі або ви отримаєте ці помилкові результати причинно-наслідкових зв’язків. Винятком буде інтегрована серія, але я посилаюсь на тексти часових рядів, щоб дізнатися більше про це.


5
+1, наприклад, хибної регресії. Буде використовувати його на лекціях :)
mpiktas

1
Е, ви ходите в тренажерний зал, щоб НАДАЛИТИ вагу? :)
hans0l0

6

Таку ж інтуїцію, як і при регресії поперечного перерізу, можна використовувати при регресії часових рядів. Цілком справедливо спробувати пояснити тенденцію, використовуючи інші змінні. Основна відмінність полягає в тому, що неявно передбачається, що регресори є випадковими змінними. Отже, в регресійній моделі:

Yt=β0+Xt1β1+...+Xtkβk+εt

ми вимагаємо E(εt|Xt1,...,Xtk)=0 замість Eεt=0 і E(εt2|Xt1,...,Xtk)=σ2 замість Eεt2=σ2.

Практична частина регресії залишається однаковою, застосовуються всі звичайні статистичні дані та методи.

Важкою частиною є показати, для яких типів випадкових змінних або в цьому випадку стохастичні процеси Xtkми можемо використовувати класичні методи. Звичайну центральну граничну теорему застосувати не можна, оскільки вона включає незалежні випадкові величини. Процеси часових рядів зазвичай не є незалежними. Ось тут важливе значення має стаціонарність. Показано, що для значної частини стаціонарних процесів можна застосувати центральну граничну теорему, тому можна застосувати класичний регресійний аналіз.

Основний застереження регресії часових рядів полягає в тому, що він може масово вийти з ладу, коли регресори не є нерухомими. Тоді звичайні методи регресії можуть показати, що тенденція пояснюється, коли насправді це не так. Отже, якщо ви хочете пояснити тенденцію, ви повинні перевірити наявність нестаціонарності, перш ніж продовжувати. Інакше ви можете прийти до помилкових висновків.


1
Дякую за Ваше терпіння. Все-таки ВВП міг би бути поясненням моєї змінної. Можливо, я краще використовую темпи зростання, тому що в іншому випадку це просто представляє тенденцію часу. Причина, чому я хочу використовувати регресію, полягає в тому, що мені цікаво витягти те, що насправді НЕ пояснюється змінними тенденціями часу, такими як ВВП.
hans0l0

1
@ ran2, завжди краще використовувати зростання ВВП замість його реальної вартості. Зауважте, що регресійний аналіз також може сказати вам, що змінні не пояснюють тенденцію, тож, можливо, ви отримаєте результат, що немає змінних, які могли б пояснити вашу тенденцію (або змінні, про які ви думали, не пояснюють тенденцію).
mpiktas

1
@raegtin, наприклад, стаціонарні процеси, які не мають другого моменту.
mpiktas

1
Єдине, що я хотів би додати, - бути обережним із використанням світового "пояснення". Деяким рецензентам це не сподобається.
Jase

1
@ Джасе, добре, що я використовував цей термін в певному сенсі, про що йдеться в ОП, тобто знайти значущі статистичні відносини.
mpiktas

3

Якщо у вас є підтримуючий / причинно-наслідковий / допомагаючий / правий бік / екзогенний / передбачувальний ряд, переважним підходом є побудова єдиного рівняння, функції передачі з декількома входами. Потрібно вивчити можливі залишки моделі як для неозначених / пропущених детермінованих входів, тобто виявити інтервенцію ala Ruey Tsay 1988 Журнал прогнозування та не визначені стохастичні входи через компонент ARIMA. Таким чином, ви можете чітко включати не тільки запропоновані користувачем причини (та будь-які потрібні лаги!), Але й два види опущених структур (манекени та ARIMA).

Слід обережно стежити за тим, щоб параметри кінцевої моделі з часом не змінювалися суттєво, інакше сегментація даних може бути в порядку та не може бути доведено, що залишки від кінцевої моделі мають неоднорідну дисперсію.

Тенденція в оригінальній серії може бути обумовлена ​​тенденціями в серії передбачувачів або через Авторегресивну динаміку в цікавій серії або потенційно через опущений детермінований ряд, який проксимується постійною сталою константою або навіть однією або кількома локальними тенденціями часу.


0

Як менш технічна точка зору, часто не дуже корисно лише пояснити тенденцію; тобто трактувати час як предиктор першочергового інтересу. Варіація серії з часом часто передбачає основні ефекти інших змінних, включаючи авторегресивні та / або екзогенні процеси, що більш концептуально має значення для дослідження. Звідси випливає, що якщо ці змінні також змінюються з часом, то контролювати ефект часу потрібно насправді, щоб не потрапляти у штучно значущі відносини, як показало @mpiktas.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.