Гарні практики при прогнозуванні часових рядів


10

Я працював місяцями над короткостроковим прогнозуванням навантаження та використанням даних про клімат / погоду для підвищення точності. У мене є інформація з інформатики, і тому я намагаюся не робити великих помилок і несправедливих порівнянь, працюючи з інструментами статистики, такими як моделі ARIMA. Мені хотілося б дізнатися вашу думку про пару речей:

  1. Я використовую обидві (S) ARIMA та (S) ARIMAX моделі для дослідження впливу погодних даних на прогнозування, чи вважаєте ви, що потрібно буде використовувати також методи експоненціального згладжування?

  2. Маючи часовий ряд із 300 проб щодня, я починаю з перших двох тижнів і виконую прогноз на 5 днів вперед, використовуючи моделі, побудовані з функцією auto.arima R (пакет прогнозів). Потім я додаю ще один зразок до мого набору даних і знову калібрую моделі і виконую ще 5 днів прогнозу і так далі до кінця наявних даних. Як ви вважаєте, цей спосіб роботи є правильним?

Дякую за ваші пропозиції, хоча мета нашої роботи - стаття в інженерному журналі, я хотів би зробити роботу якомога жорсткішою зі статистичної точки зору.


1
Це питання, здається, тісно пов'язане: stats.stackexchange.com/questions/16915/…
whuber

1
Ось стара відповідь stats.stackexchange.com/questions/6513/…
bill_080

Відповіді:


9
  1. Я думаю, що варто було б також вивчити експоненціальні моделі згладжування. Експоненціальні моделі згладжування принципово відрізняються від моделей ARIMA і можуть давати різні результати щодо ваших даних.

  2. Це звучить як вірний підхід і дуже схоже на метод перехресної перевірки часових рядів, запропонований Роб Хайндманом .

Я б узагальнив помилку перехресної перевірки з кожного прогнозу (експоненціальне згладжування, ARIMA, ARMAX), а потім використаю загальну помилку для порівняння трьох методів.

Ви також можете розглянути "пошук мережі" для параметрів ARIMA, а не використовувати auto.arima. Під час пошуку в сітці ви досліджуєте кожен можливий параметр для моделі arima, а потім вибираєте "найкращі", використовуючи точність прогнозу.


Дякую за відповідь, я використовую auto.arima з відключеним пошуком STEPWISE, і я думаю, що таким чином він вивчить усі параметри між діапазоном міні-макс (я ще не читав папери Hyndman & Kandahar 2008)
Маттео Де Феліче

@Matteo De Felice: справа в тому, що це оптимізація цих параметрів на основі AIC. Я припускав, що, можливо, варто оптимізувати ці параметри за вибірковими показниками, які можна оцінити шляхом перехресної перевірки. Крім того, якщо ви хочете порівняти інші моделі (наприклад, ETS), вам знадобиться вибірковий показник продуктивності, оскільки ви не можете порівнювати AIC між різними типами моделей (наприклад, auto.arima та ets).
Зак

в цей момент я здійснив пошук по сітці (використовуючи auto.arima з кроком = FALSE), а потім спробував найчастіші моделі, щоб оцінити їх ефективність.
Маттео Де Феліче

@Matteo De Felice: Якщо у вас виникли проблеми із впровадженням перехресної перевірки часових рядів, ця публікація в блозі може допомогти: robjhyndman.com/researchtips/tscvexample
Zach

Слід зазначити, що моделі ARIMA та ETS принципово не відрізняються. Насправді, лінійні експоненціальні згладжувальні моделі є особливими випадками моделей ARIMA. Дивіться тут: otexts.org/fpp/8/10 .
Бородавка
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.