Оцініть коефіцієнти ARMA за допомогою перевірки ACF та PACF


16

Як ви оцінюєте відповідну модель прогнозування для часового ряду шляхом візуального огляду сюжетів АКФ та ПАКФ? Який з них (тобто ACF або PACF) повідомляє AR або MA (або вони обидва)? Яка частина графіків розповідає про сезонну та несезонну частину сезонного ARIMA?

Розглянемо функції ACF та PCF, показані нижче. Вони складаються з журналу, трансформованого серії, який відрізнявся двічі, одна проста різниця та одна сезонність ( оригінальні дані , дані , перетворені журналом ). Як би ви охарактеризували серіал? Яка модель найкраще підходить?

введіть тут опис зображення

Відповіді:


12

Моя відповідь - це дійсно скорочення публікації Jalacelace, але вона занадто довга для простого коментаря, але не надто коротка, щоб бути марною.

Хоча відповідь jvlacelle є технічно правильною на одному рівні, вона "надмірно спрощує", оскільки вміщує певні "речі", які зазвичай ніколи не відповідають дійсності. Він передбачає, що не потрібна детермінована структура, така як одна чи більше часових тенденцій АБО один або кілька зрушень рівня або один або більше сезонних імпульсів або один або більше одноразових імпульсів. Крім того, передбачається, що параметри ідентифікованої моделі з часом є інваріантними, а процес помилки, що лежить в основі попередньо визначеної моделі, також є інваріантним у часі. Ігнорування будь-якого з перерахованого вище часто (завжди, на мою думку!) Є рецептом катастрофи або, точніше, "погано визначеною моделлю". Класичним випадком цього є непотрібне логарифмічне перетворення, запропоноване для серії авіакомпаній та для серії, яку ОП представляє у своєму переглянутому питанні. Немає ніяких логарифмічних перетворень для його даних, оскільки є лише кілька «незвичайних» значень у періоди 198,207,218,219 та 256, які не обробляються, створюючи помилкове враження, що існує більш висока різниця помилок з більш високими рівнями. Зауважте, що "незвичні значення" ідентифікуються з урахуванням будь-якої необхідної структури ARIMA, яка часто уникає людського ока. Трансформації потрібні, коли відхилення помилок є незмінними протягом часу НЕ, коли дисперсія спостережуваного Y незмінна в часі . Первісні процедури все ще роблять тактичну помилку вибору трансформації передчасно перед будь-яким із вищезазначених засобів захисту. Потрібно пам’ятати, що простодушна стратегія ідентифікації моделі ARIMA була розроблена на початку 60-х, Але з тих пір багато розробок / удосконалень. 219 та 256, які не обробляються, створюють помилкове враження, що існує більша різниця помилок з більш високими рівнями. Зауважте, що "незвичні значення" ідентифікуються з урахуванням будь-якої необхідної структури ARIMA, яка часто уникає людського ока. Трансформації потрібні, коли відхилення помилок є незмінними протягом часу НЕ, коли дисперсія спостережуваного Y незмінна в часі . Первісні процедури все ще роблять тактичну помилку вибору трансформації передчасно перед будь-яким із вищезазначених засобів захисту. Потрібно пам’ятати, що простодушна стратегія ідентифікації моделі ARIMA була розроблена на початку 60-х, Але з тих пір багато розробок / удосконалень відбулися. 219 та 256, які не обробляються, створюють помилкове враження, що існує більша різниця помилок з більш високими рівнями. Зауважте, що "незвичні значення" ідентифікуються з урахуванням будь-якої необхідної структури ARIMA, яка часто уникає людського ока. Трансформації потрібні, коли відхилення помилок є незмінними протягом часу НЕ, коли дисперсія спостережуваного Y незмінна в часі . Первісні процедури все ще роблять тактичну помилку вибору трансформації передчасно перед будь-яким із вищезазначених засобів захисту. Потрібно пам’ятати, що простодушна стратегія ідентифікації моделі ARIMA була розроблена на початку 60-х, Але з тих пір багато розробок / удосконалень відбулися. ідентифікуються з урахуванням будь-якої необхідної структури ARIMA, яка часто уникає людського ока. Трансформації потрібні, коли дисперсія помилок є незмінною протягом часу НЕ, коли дисперсія спостережуваного Y є незмінною протягом часу. Первісні процедури все ще роблять тактичну помилку вибору трансформації передчасно перед будь-яким із вищезазначених засобів захисту. Потрібно пам’ятати, що простодушна стратегія ідентифікації моделі ARIMA була розроблена на початку 60-х, Але з тих пір багато розробок / удосконалень відбулися. ідентифікуються з урахуванням будь-якої необхідної структури ARIMA, яка часто уникає людського ока. Трансформації потрібні, коли дисперсія помилок є незмінною протягом часу НЕ, коли дисперсія спостережуваного Y є незмінною протягом часу. Первісні процедури все ще роблять тактичну помилку вибору трансформації передчасно перед будь-яким із вищезазначених засобів захисту. Потрібно пам’ятати, що простодушна стратегія ідентифікації моделі ARIMA була розроблена на початку 60-х, Але з тих пір багато розробок / удосконалень відбулися. Первісні процедури все ще роблять тактичну помилку вибору трансформації передчасно перед будь-яким із вищезазначених засобів захисту. Потрібно пам’ятати, що простодушна стратегія ідентифікації моделі ARIMA була розроблена на початку 60-х, Але з тих пір багато розробок / удосконалень відбулися. Первісні процедури все ще роблять тактичну помилку вибору трансформації передчасно перед будь-яким із вищезазначених засобів захисту. Потрібно пам’ятати, що простодушна стратегія ідентифікації моделі ARIMA була розроблена на початку 60-х, Але з тих пір багато розробок / удосконалень відбулися.

Відредаговано після публікації даних:

Розумна модель була визначена за допомогою http://www.autobox.com/cms/, яка є частиною програмного забезпечення, яка включає деякі мої вищезгадані ідеї, коли я допомагав її розробляти. введіть тут опис зображенняТест Чоу на сталість параметрів запропонував сегментувати дані та використовувати останні 94 спостереження як параметри моделі, які змінювалися з часом. введіть тут опис зображення. Ці останні 94 значення дали рівняння, введіть тут опис зображенняпричому всі коефіцієнти були значущими. введіть тут опис зображення. Сюжет залишків передбачає розумне розсіювання введіть тут опис зображенняз наступним ACF, що пропонує випадковість введіть тут опис зображення. Фактичний та очищений графік світиться, оскільки він показує тонкі, але значні видатки. введіть тут опис зображення. Нарешті сюжет актуальних, придатних та прогнозованих підсумків підсумовує нашу роботу ВСЕ БЕЗ ВИКОРИСТАННЯ ЛОГАРИТМІВвведіть тут опис зображення. Добре відомо, але часто забуваємо, що силові трансформації - це як наркотики .... необґрунтоване використання може завдати вам шкоди. Нарешті зауважте, що модель має AR (2), але не AR (1) структуру.


чому ми не можемо прийняти перетворення журналу? Будь ласка, перегляньте набір даних AirPassengers в R, який має мультиплікативну сезонність. Взявши журнал, перетворює його на додаткову сезонність. Крім того, якщо ми не беремо журнали, набір даних матиме дедалі більшу дисперсію, тобто він не буде нерухомим. Як я можу працювати з таким набором даних, не приймаючи перетворення журналу? Чи можете ви поясніть, будь ласка?
користувач2338823

"Немає необхідності в будь-яких логарифмічних перетвореннях для його даних, оскільки є лише кілька" незвичайних "значень у періоди, які не лікуються, створюють помилкове враження, що існує більша дисперсія помилок з більш високими рівнями". припущення про стаціонарність постійності дисперсії стосується дисперсії помилок, а не дисперсії оригінальної серії. Програмне забезпечення R не дозволяє автоматично визначати та включати аномалії. дивіться autobox.com/cms/index.php/blog обговорення серії. AND autobox.com/pdfs/vegas_ibf_09a.pdf
IrishStat

Тест Box-Cox для силового перетворення ВСТУПНУЄ без залишків, тому він може помилково / ненавмисно пов'язати зміну дисперсії з очікуваною величиною, таким чином, неправильно підказуючи необхідність трансформації. Дивіться статтю Цая docplayer.net/… від одного зі студентів Боксу як вступ до боротьби з нелікованою латентною детермінованою структурою. зміна дисперсії або через сильну трансформацію, або GLS, як вказує Цей.
IrishStat

14

Тільки для прояснення понять шляхом візуального огляду ACF або PACF ви можете вибрати (не оцінювати) орієнтовну модель ARMA. Після вибору моделі ви можете оцінити модель шляхом максимізації функції ймовірності, мінімізації суми квадратів або, у випадку моделі AR, за допомогою методу моментів.

Модель ARMA може бути обрана після огляду ACF та PACF. Цей підхід спирається на такі факти: 1) ACF стаціонарного AR процесу порядку p переходить до нуля при експоненціальній швидкості, тоді як PACF стає нульовим після відставання p. 2) Для процесу МА порядку q теоретичні ACF та PACF виявляють зворотну поведінку (ACF скорочується після відставання q, а PACF відносно швидко нульовий).

Зазвичай зрозуміло, щоб визначити порядок моделі AR або MA. Однак при процесах, що включають як частину AR, так і МА, відставання, при якому вони усічені, може бути розмитим, оскільки і ACF, і PACF зменшиться до нуля.

Один із способів продовжити - це підходити спочатку до моделі AR або MA (тієї, яка здається більш зрозумілою в ACF та PACF) низького рівня. Тоді, якщо є якась подальша структура, вона відображатиметься в залишках, тому ACF і PACF залишків перевіряється, щоб визначити, чи потрібні додаткові умови AR або MA.

Зазвичай вам доведеться спробувати діагностувати більше однієї моделі. Ви також можете порівняти їх, поглянувши на AIC.

ACF та PACF, які ви опублікували вперше, запропонували ARMA (2,0,0) (0,0,1), тобто звичайний AR (2) та сезонний MA (1). Сезонна частина моделі визначається аналогічно звичайній частині, але з огляду на відставання сезонного порядку (наприклад, 12, 24, 36, ... у щомісячних даних). Якщо ви використовуєте R рекомендується збільшити кількість за замовчуванням лагов, які відображаються, acf(x, lag.max = 60).

Сюжет, який ви показуєте зараз, виявляє підозрілі негативні кореляції. Якщо цей сюжет базується на тому ж, що і в попередньому сюжеті, можливо, ви взяли занадто багато відмінностей. Дивіться також цей пост .

Більш детальну інформацію ви можете отримати, серед інших джерел, тут: Глава 3 у часових рядах: Теорія та методика Пітера Дж. Броквелла та Річарда А. Девіса та тут .


Ти маєш рацію. Можливо, я взяв одну різницю занадто багато. Я маю одне сумнів, хоча. Я змінив просту різницю ( i.imgur.com/1MjLzlX.png ) та сезонну (12) ( i.imgur.com/E64Sd7p.png ) обидві дані журналу. На яку з них я повинен звернути увагу, сезонна?
годинивчення

1
@ 4everlearning Right, після прийняття сезонних відмінностей ACF і PACF виглядає ближче до того, що ми могли б очікувати для стаціонарного процесу. Почати можна, встановивши в R R ARIMA (2,0,0) (0,1,1) arima(x, order = c(2,0,0), seasonal = list(order = c(0,1,1)))та відобразивши ACF та PACF залишків. Будьте також в курсі подальших питань, порушених IrishStat, з якими вам слід займатися в аналізі.
javlacalle

Спасибі. Як би я пішов про пошук цих замовлень AR та MA? Крім того, інформаційний критерій Akaike дає негативне значення для моєї моделі. Я розумію, що це не важливо, хоча я не дуже впевнений, як порівняти його з іншими моделями, скажімо, AIC = -797.74 та AIC = -800.00. Що є кращим?
годинивчення

Ви можете визначити замовлення, виходячи з ідеї, наведеної у відповіді вище. Якщо ви бачите, що ACF виходить на нуль відносно швидко і PACF скорочується після відставання 2, можливо, в даних присутня структура AR (2). Зворотна ідея застосовується для виявлення МА. Як загальна рекомендація, почніть з моделі низького порядку та огляньте залишки, які шукають структури AR або MA, які будуть додані до початкової моделі.
javlacalle

Як правило, чим нижчий AIC, тим кращою є модель (якщо припустити, що ви використовуєте дані в одній шкалі в обох моделях, тобто серія повинна бути або за рівнями, або для журналів у всіх моделях, з якими ви порівнюєте ).
javlacalle
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.