Вибір моделі Box-Jenkins


14

Процедура вибору моделі Box-Jenkins в аналізі часових рядів починається з перегляду функцій автокореляції та часткової автокореляції серії. Ці графіки можуть запропонувати відповідні і у моделі ARMA . Процедура продовжується, вимагаючи від користувача застосувати критерії AIC / BIC для вибору найбільш парсимоніальної моделі серед тих, що виробляють модель із терміном помилки білого шуму.pq(p,q)

Мені було цікаво, як ці етапи візуального огляду та вибору моделі на основі критеріїв впливають на оціночні стандартні помилки кінцевої моделі. Я знаю, що багато процедур пошуку в домені з поперечним перерізом можуть зміщувати, наприклад, стандартні помилки.

На першому кроці, як вибір відповідної кількості лагів, переглядаючи дані (ACF / PACF), впливає на стандартні помилки для моделей часових рядів?

Я б припустив, що вибір моделі на основі балів AIC / BIC матиме вплив, аналогічний такому для методів поперечного перерізу. Насправді я теж мало знаю про цю сферу, тому будь-які коментарі будуть оцінені і з цього приводу.

Нарешті, якщо ви записали точний критерій, що використовується для кожного кроку, чи можете ви завантажувати весь процес для оцінки стандартних помилок та усунення цих проблем?


чи так важливо зміщення стандартних помилок (параметрів?) в теоретичних моделях ARMA? Моделі ARMA ASFAIK використовуються в основному для короткострокових прогнозів. Проблеми з інтерпретацією параметрів та їх властивостями менш важливі (найменш?). Звичайно, якщо ви не маєте на увазі характеристики інноваційного процесу (термін помилки), плануєте виробляти відповідні інтервали прогнозування.
Дмитро Челов

@Dmitrij, Є дві основні причини, чому мене турбує упередженість у стандартних похибках коефіцієнтів. Перший, як ви нагадали, - це створення інтервалів передбачення. Друге - це тестування на структурні розриви в моделі, поширене питання, на яке економіст був би зацікавлений у відповіді. Стандартні помилки, згенеровані за допомогою процедури відбору, повинні бути занадто малими, даючи занадто вузькі інтервали прогнозування та занадто великі статистичні дані тесту.
Чарлі

але в теоретичних моделях (тобто немає теорії, немає структури) структурні розриви мало пов'язані з параметрами, це були б деякі загальні тести, що стосуються поведінки залишків моделі. Ну а в цьому випадку неупереджені оцінки параметрів моделей менш важливі, ARMA просто не має інтерпретації структурних моделей. Таким чином, парсимоніальні моделі справді є кращими прогнозами, оскільки вони добре врівноважують зазвичай погані властивості малих оцінок вибірки та точність прогнозування.
Дмитро Челов

Зауважте, що навіть якщо ви знаєте процес генерування даних, який має безліч параметрів, у невеликих зразках спрощена модель, ймовірно, зробить кращі прогнози, але в структурному контексті параметри такої моделі будуть дуже упередженими (опущені змінні зміщення)!
Дмитро Челов

Відповіді:


5

Будь-яка процедура вибору моделі вплине на стандартні помилки, і це навряд чи враховується. Наприклад, інтервали прогнозування обчислюються умовно на оціненій моделі, а оцінка параметрів та вибір моделі зазвичай ігноруються.

Потрібно мати можливість завантажувати всю процедуру, щоб оцінити ефект від процесу вибору моделі. Але пам’ятайте, що завантажування часових рядів складніше, ніж звичайне завантаження, оскільки вам потрібно зберегти послідовну кореляцію. Блоковий завантажувач є одним із можливих підходів, хоча він втрачає деяку послідовну кореляцію через структуру блоку.


6

На мою думку, вибір відповідної кількості лагів не відрізняється від вибору кількості вхідних рядів у процесі покрокової регресії вперед. Послідовна важливість лага або конкретного ряду вхідних даних є основою для попередньої специфікації моделі.

Оскільки ви стверджували, що ACF / Pacf є єдиною основою для вибору моделі Box-Jenkins, дозвольте мені розповісти, чому мене навчив певний досвід. Якщо серія демонструє ACF, який не розпадається, підхід Box-Jenkins (близько 1965 р.) Пропонує диференціювати дані. Але якщо серія має зсув рівня, як дані про Ніл , то "візуально очевидна" нестаціонарність є симптомом необхідної структури, але розрізнення не є засобом захисту. Цей набір даних Нілу можна моделювати без розрізнення, просто спочатку визначивши потребу в зсуві рівня. У подібному руслі нас навчають, використовуючи 1960 концепцій, що якщо ACF має сезонну структуру ( тобтозначущі значення при відставаннях s, 2s, 3s, ...), тоді ми повинні включати сезонний компонент ARIMA. Для цілей обговорення розгляньте серію, яка нерухома навколо середнього значення та з фіксованими інтервалами, скажімо, що кожного червня існує "велике значення". Ця серія належним чином обробляється, включаючи "старомодні" манекени серії 0 і 1 (у червні) для лікування сезонної структури. Сезонна модель ARIMA неправильно використовує пам'ять замість не визначеної, але змінної X, що чекає. Ці дві концепції ідентифікації / включення невизначеної детермінованої структури є прямими застосуваннями роботи І. Чанга, Вільяма Белла, Джорджа Тяо, Р.Цей , Чена та ін (починаючи з 1978 р.) Під загальною концепцією виявлення втручання.

Навіть сьогодні деякі аналітики бездумно виконують стратегії максимізації пам’яті, називаючи їх автоматичною ARIMA, не визнаючи, що «бездумне моделювання пам’яті» передбачає, що детерміновані структури, такі як імпульси, зсув рівня, сезонні імпульси та місцеві тенденції часу, не існують або ще гірше, але вони не грають роль у ідентифікації моделі. Це схоже на покладення голови в пісок, ІМХО.


Дякую за чудові поради щодо вибору моделі, але мене зацікавило, як цей процес впливає на наш висновок згодом.
Чарлі

Чарлі: Я не вірю, що попередні діагностики даних, такі як перегляд автокореляцій, перехресних кореляцій або будь-яка інша Процедура ідентифікації моделі, як графічні презентації, впливає на статистичну значимість будь-яких оцінених параметрів. Це моя думка, і "тут я стою, я не можу робити іншого". Дякую за кудо, і якщо я можу допомогти молодому Чарлі будь-яким чином, будь ласка, зв’яжіться зі мною, оскільки я люблю, щоб мене вказали в якості допоміжного (неоплаченого!) Ресурсу в кандидатських дисертаціях.
IrishStat
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.