Коли потрібно увійти, перетворіть часовий ряд, перш ніж підходити до моделі ARIMA


26

Раніше я використовував прогноз про для прогнозування одномірного часового ряду, але перемикаю свій робочий процес на Р. Пакет прогнозування для R містить безліч корисних функцій, але одне, що він не робить, - це будь-яке перетворення даних перед запуском автоматичного .arima (). У деяких випадках прогноз про вирішує записати дані перетворення, перш ніж робити прогнози, але я ще не зрозумів, чому.

Отже, моє питання: коли я повинен увійти-перетворити свій часовий ряд, перш ніж спробувати методи ARIMA?

/ редагувати: прочитавши ваші відповіді, я буду використовувати щось подібне, де x - мій часовий ряд:

library(lmtest)
if ((gqtest(x~1)$p.value < 0.10) {
    x<-log(x)
}

Це має сенс?

Відповіді:


21

Деякі застереження, перш ніж продовжувати. Як я часто пропоную своїм студентам, використовуйте auto.arima()речі лише як перше наближення до вашого кінцевого результату або, якщо ви хочете мати парсимоніальну модель, коли перевіряєте, чи працює ваша суперницька теоретична модель краще.

Дані

Ви повинні чітко почати з опису даних часових рядів, з якими працюєте. У макроеконометрії ви, як правило, працюєте з агрегованими даними, а геометричні засоби (на диво) мають більш емпіричні дані для даних часових рядів макросу, мабуть, тому, що більшість з них можна розкласти на експоненціально зростаючий тренд .

До речі, пропозиція Роб "візуально" працює для часових рядів з чіткою сезонною частиною , оскільки повільно змінюються річні дані менш зрозумілі для збільшення варіацій. На щастя, зазвичай спостерігається експоненціально зростаюча тенденція (якщо вона здається лінійною, ніж необхідність в журналах).

Модель

Якщо ваш аналіз базується на деякій теорії, яка стверджує, що деяке середньозважене середнє геометричне більш відоме як мультиплікативна регресійна модель - це та, з якою вам доведеться працювати. Потім ви зазвичай переходите до моделі регресії журналу журналу журналу , тобто лінійної за параметрами, і більшість ваших змінних, але деякі темпи зростання, трансформуються.Y(т)=Х1α1(т)...Хкαк(т)ε(т)

У фінансовій економетрії журнали є звичайною справою через популярність журналів повернення, тому що ...

Перетворення журналу мають приємні властивості

У логарифмічною регресійній моделі це інтерпретація оцінюваного параметра, скажімо як еластичність в на . Y ( t ) X i ( t )αiY(т)Хi(т)

У моделях виправлення помилок ми маємо емпірично більш сильне припущення, що пропорції більш стійкі ( нерухомі ), ніж абсолютні різниці.

У фінансовій економетрії легко агрегувати часові прибутки з часом .

Тут є багато інших причин, про які не йдеться.

Нарешті

Зауважте, що журнальне перетворення зазвичай застосовується до негативних (рівневих) змінних. Якщо ви спостерігаєте відмінності двох часових рядів (наприклад, чистий експорт), навіть неможливо взяти журнал, вам доведеться або шукати оригінальні дані за рівнями, або приймати форму загальної тенденції, яка була віднята.

[ додаток після редагування ] Якщо ви все ще хочете статис- тичним критерієм, коли робити перетворення журналу, простим рішенням буде будь-який тест на гетероседастичність. У разі збільшення дисперсії я рекомендував би тест Гольдфельда-Квандта або подібний до нього. У R він знаходиться в library(lmtest)і позначається gqtest(y~1)функцією. Просто регресуйте на терміні перехоплення, якщо у вас немає жодної моделі регресії, yє вашою залежною змінною.


дякую за інформацію. При тесті на GQ, чим нижче значення р, тим більше ймовірність, що розподіл гетерокедастичний?
Зак

@Zach: точно, візьміть, наприклад, 5%, звичайно, якщо ви не плануєте йти на пошук даних. Я особисто починаю з припущень моделі.
Дмитро Челов

@Dmitrij. Дякую. Я просто хочу переконатися, що я правильно інтерпретую результат.
Зак

29

Накресліть графік даних за часом. Якщо схоже, що різниця збільшується з рівнем серії, візьміть журнали. В іншому випадку моделюйте вихідні дані.


3
Ось питання: який ефект, якщо ви берете журнали, і вони не вимагаються? Мені це сподобалось, коли працюю з часовими рядами, які вимагають перетворення журналу, тому що (наскільки я це розумію) коефіцієнти є співвідношеннями і при малих значеннях майже відсотками. (Наприклад, exp (0,05) = 1,051.)
Уейн

4

За їхніми плодами ти їх знаєш

Припущення (тестуватися) полягає в тому, що помилки в моделі мають постійну дисперсію. Зауважте, це не означає помилки з припущеної моделі. Використовуючи простий графічний аналіз, ви по суті припускаєте лінійну модель у часі.

Таким чином, якщо у вас є неадекватна модель, яка може бути запропонована випадковим графіком даних за часом, ви можете неправильно зробити висновок про необхідність перетворення потужності. Box і Jenkins зробили це на прикладі Airline Data. Вони не враховували 3 незвичайних значення в останніх даних, тому вони неправильно зробили висновок, що в залишках на найвищому рівні серії спостерігається більша різниця.

Детальніше з цього приводу див. Http://www.autobox.com/pdfs/vegas_ibf_09a.pdf


1

Можливо, ви хочете записати рядки перетворення, коли вони якимось чином природні геометричні або коли часова вартість інвестиції означає, що ви будете порівнювати з облігацією з мінімальним ризиком, яка має позитивну віддачу. Це зробить їх більш "лінійними" і, отже, придатними для простого диференціювання рецидивів.


1
Трансформації - це як наркотики: деякі корисні для вас, а інші - ні. Якщо tou не цікавить тестування статистичної гіпотези, тоді ви можете припустити все, що завгодно. Параметричні тести гіпотези мають припущення про ціну помилок, ігноруйте їх з вашої небезпеки.
IrishStat

1
Такий справжній. Я сказав, що процес повинен бути геометричним. Невдача перетворення також може призвести до помилок у висновку. Я не бачу, де я пропонував би ігнорувати припущення щодо умов дійсного висновку.
DWin

1
stats.stackexchange.com/questions/6498/… включав обговорення, коли і навіщо трансформуватися. "Факт" того, що вихідні похідні є "геометричними", не дає висновку, що залишки від адекватної моделі мають стандартне відхилення, пропорційне середньому. Це може бути, але це повинно бути емпірично доведено або принаймні протестоване.
IrishStat
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.