Плутанина з тестом Augmented Dickey Fuller


16

Я працюю над набором даних electricityдоступні в R пакеті TSA. Моя мета - з'ясувати, чи буде arimaмодель відповідна цим даним, і, врешті-решт, їх відповідати. Тож я поступив так:

1-е: Накресліть часовий ряд, у результаті якого з'явився наступний графік: ц сюжет1

2-й: Я хотів увійти в систему, electricityщоб стабілізувати дисперсію, а потім розмежував серію в міру необхідності, але перед тим, як зробити це, я перевірив стаціонарність на оригінальний набір даних за допомогою adfтесту (Augmented Dickey Fuller) і на диво вийшов наступним чином:

Код та результати:

adf.test(electricity)

             Augmented Dickey-Fuller Test
data:  electricity 
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01 
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value

Що ж, згідно з уявленням мого початківця про часовий ряд, я вважаю, що це означає, що дані є стаціонарними (невелика p-величина, відкидає нульову гіпотезу про нестаціонарність). Але дивлячись на сюжет ц, я не знаходжу, що це може бути нерухомим. Хтось має вагоме пояснення цьому?


5
ADF тестує лише для одиничного кореневого блоку, це може бути тенденцією стаціонарно. Тож вам слід скористатися тестом KPSS, див. Stats.stackexchange.com/questions/30569/… Загалом, між DS (стаціонарними різницями) та TS (тенденція стаціонарними) є різниця. KPSS - це кращий тест для розрізнення цих моделей, див. Посилання для більш детальної інформації.
Stat Tistician

3
Схоже, серіал має сезони та тренди. Інтегруйте в тест ADF детермінований тренд + сезонні манекени та запустіть тест. Перевірте також наявність автокорельованих залишків.
Пантера

Відповіді:


12

adf.testхт-хт-1

> adf.test(electricity, k=12)

Augmented Dickey-Fuller Test
data:  electricity
Dickey-Fuller = -1.9414, Lag order = 12, p-value = 0.602
alternative hypothesis: stationary

2

Якщо припустити, що "adf.test" дійсно походить з пакету "tseries" (прямо чи опосередковано), то причиною буде те, що воно автоматично включає лінійну тенденцію часу. Із документа tseries (версія 0.10-35): "Використовується загальне рівняння регресії, яке включає константу та лінійну тенденцію [...]" Отже, результат тесту дійсно вказує на стаціонарність тренда (який, незважаючи на назву, не є стаціонарним).

Я також погоджуюся з Pantera, що сезонні наслідки можуть спотворити результат. Насправді ця серія може бути тенденцією часу + детерміновані сезони + кореневий процес стохастичної одиниці, але тест АРД може неправильно трактувати сезонні коливання як стохастичні перетворення детермінованого тренду, що означатиме коріння менші за єдність. (З іншого боку, враховуючи, що ви включили достатню кількість затримок, це, скоріше, повинно відображатися як (помилкове) одиничне коріння на сезонних частотах, а не нульову / довгострокову частоту, на яку виглядає тест АПД. У будь-якому випадку, враховуючи сезонний малюнок, краще включити сезонні.)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.