Прогноз часового ряду Аріма (auto.arima) з декількома зовнішніми змінними в R


14

Я хотів би провести прогноз, заснований на множинній часовій серії ARIMA-моделі з безліччю зовнішніх змінних. Оскільки я не такий вмілий, що стосується ані статистики, ані ІР, яку я не хочу зберігати, є максимально простим (прогноз тенденцій на 3 місяці достатній).

У мене є 1 залежний часовий ряд і 3-5 часових рядів прогнозу, всі місячні дані, відсутність прогалин, той самий "горизонт".

Я зіткнувся з функцією auto.arima і запитав себе, чи це буде підходящим рішенням для моєї проблеми. У мене різні ціни на товари та ціни на вироблені з них продукти. Усі необроблені дані є нестаціонарними, але шляхом розмежування першого порядку вони стають стаціонарними даними. ADF, KPSS вказують на це. (Це означає, що я перевірив інтеграцію, правда?).

Моє запитання зараз: Як застосувати це за допомогою функції auto.arima І чи справді АРІМА правильний підхід? Деякі ppl вже запропонували мені використовувати VAR, але чи можливо це і для ARIMA?

У наступній таблиці - мої дані. Насправді набір даних триває до 105 спостережень, але перші 50 дійдуть. Тут очевидно цікавий тренд, а також сезонність.

введіть тут опис зображення

Дякуємо за будь-які поради та допомогу! Георг


будь ласка, опублікуйте ваші дані, щоб їх можна було завантажити. використовувати excel. Це може бути просто завдання виявити непотрібні (можливо, значні перехресні кореляції) рядів введення. Я не думаю, що VAR необхідний або Принципові компоненти, корисні для цієї проблеми
IrishStat

Відповіді:


10

у

Для auto.arima()роботи із зовнішніми регресорами збирайте регресори в матрицю X, в яку ви вводите xregпараметр auto.arima(). (Звичайно, Xмає бути така ж кількість рядків, як часовий ряд, який yви моделюєте.)

Для прогнозування вам знадобляться майбутні значення регресорів, які ви знову вводите в xregпараметр forecast.

Сторінки довідки є ?auto.arimaі ?forecast.Arima(зверніть увагу на велику літеру А - це не друкарня. Не питайте мене ...).


1
(+1) Ви могли б трохи детальніше розібратися з ідеєю причинності та як її перевірити. Це може бути корисним для повноти вашої відповіді, оскільки ви згадуєте, що рішення про використання ARIMA визначається напрямком причинності серед змінних. Ви, наприклад, думаєте про тест на причинність Грейнджера чи тест Хаусмана ? Дякую.
javlacalle

3
@javlacalle: Я не дуже великий фанат статистичних тестів на причинність (з них найбільш відомий тест Грейнджера). Я дуже вважаю за краще вирішувати питання про "ймовірну причинну причину" виходячи з предмету. Наприклад, я б не використовував тест Грейнджера, щоб оцінити, чи зменшення цін збільшує продаж супермаркетів чи навпаки. Також не є взаємною причиною ВВП, обмінний курс та створення робочих місць. В обох випадках справа здається достатньо очевидною, і тест у відповідності з теорією нас нічого не навчить, тоді як тест, що суперечить теорії, буде лише заплутаним (і, мабуть, не більше, ніж шумом).
Стефан Коласа

1
... Я знаю, що я відкриваюсь до полум’я своїм останнім коментарем ;-)
Стефан Коласа

@ Stephan: Дякую за ваш внесок. Хоча мій y визначено, викликаний моїми регресорами, а не іншим способом, але мої регресори однозначно співвідносяться один з одним, а також повинні мати більш-менш прямий вплив один на одного. Згідно з вашим коментарем, це означає, що я повинен використовувати VAR замість arima, оскільки це дозволить уникнути проблем (?). Я тут використовую набір цін на товари / товари, які в основному всі пов'язані один з одним до певного моменту. "Сировина" - це мій Y, продукти з ланцюга вартості, а також побічні продукти тощо - це мої прогнози.
Джордж

1
Знання контексту даних завжди корисне, і результати будь-якого аналізу слід порівнювати з нашими апріорними знаннями. Тим не менш доцільна деяка обережність. Інтуїція іноді провалюється, а теорії, які іноді сприймаються як належне, покладаються на припущення, які не підтверджуються фактами. Але я розумію, що ви маєте на увазі і згодні в цілому.
javlacalle
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.