Як інтерпретувати сюжети ACF та PACF


10

Я просто хочу перевірити, чи правильно я інтерпретую графіки ACF та PACF:

введіть тут опис зображення

введіть тут опис зображення

Дані відповідають помилкам, згенерованим між фактичними точками даних та оцінками, згенерованими за допомогою моделі AR (1).

Я відповів на цю відповідь:

Оцініть коефіцієнти ARMA за допомогою перевірки ACF та PACF

Прочитавши, що здається, що помилки не автокорельовані, але я просто хочу бути впевненим, мої проблеми:

1.) Перша помилка знаходиться прямо на межі (коли це так, я повинен прийняти чи відхилити наявність значної автоматичної кореляції при відставанні 1)?

2.) Рядки представляють 95% довірчий інтервал, і враховуючи, що існує 116 логів, я очікую, що не більше ніж (0,05 * 116 = 5,8, які я округлюю до 6) 6 лагів перевищують межу. Для ACF це так, але для PACF існує близько 10 винятків. Якщо включити тих, хто на кордоні, це більше схоже на 14? Це все ще вказує на відсутність автоматичної кореляції?

3.) Чи повинен я щось читати про те, що всі порушення 95-відсоткового довірчого інтервалу мають місце вниз?

Відповіді:


9

У сюжетах, які ви показуєте, немає видимої структури.

Порядок відставання тих негативних часткових автокореляцій, які лежать поза діапазонами, не є кратними один одному (вони відстають, 22, 56, 62, 78, 94), тобто вони не виникають після регулярної кількості відставань, наприклад 12 , 24, 36, 48, тож я б не виводив із цього сюжету жодного візерунка.

В якості доповнення ви можете застосувати тест запуску , який є тестом на незалежність, який може бути корисним для фіксації пробігів позитивних чи негативних значень, що підказує певну закономірність даних.

Щодо значущості деяких авторських відносин, я бачу, що вони виникають при великих замовленнях. Вам слід подумати, чи мають ці автокореляції сенс чи їх можна очікувати в контексті ваших даних. Чи доцільно очікувати, що значення, яке спостерігається 56 спостережень тому, вплине на поточне спостереження? Якби ми мали щоквартальні дані, варто перевірити значну кореляцію за відставаннями 8 та 12, оскільки вони кратні періодичності даних і можуть відображати певну сезонність, яку ми могли б пояснити в контексті цих даних. Але я б не переймався тим сильним, якби значні відставання виникли при відставаннях 9, 11 або набагато вищих відставаннях, для яких я не мав пояснення, яке б виправдовувало це як звичайний зразок.


2

Корелограмне дослідження залишків (різниця між фактичною точкою даних та кошторисами) проводиться, щоб перевірити, чи не залишилися якісь суттєві закономірності даних у моделі ARIMA. Якщо вся інформація була захоплена, то ділянки ACF та PACF повинні нагадувати білий шум.

ACF і PACF для білого шуму

Якщо візуальний огляд не допомагає впевнено припустити те саме, тоді можна спробувати провести тест Box-Ljung на залишках.

Нульовою гіпотезою для цього тесту Box-Ljung буде те, що залишки не відрізняються від білого шуму.

Далі йде код для запуску тесту в r:

Box.test(residuals, lag = 28, fitdf = 5, type = "Ljung")

Значення лагу встановлюється на основі кількості коефіцієнтів автокореляції відставання, а fitdf - кількості ступеня свободи, яку потрібно відняти. Для ARIMA (p, d, q) (P, D, Q) m, я зазвичай встановлюю fitdf = (p + q + P + Q)

Якщо тест Box-Ljung повертає велике p-значення, це говорить про те, що у залишків немає інших автокореляцій, тобто вони нагадують білий шум.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.