Прогноз ARIMA з сезонністю та тенденцією, дивний результат


9

Коли я вступаю в прогнозування за допомогою моделей ARIMA, я намагаюся зрозуміти, як я можу покращити прогноз на основі підходу ARIMA із сезонністю та дрейфом.

Мої дані - наступний часовий ряд (понад 3 роки, з чіткою тенденцією вгору та видимою сезонністю, яка, схоже, не підтримується автокореляцією з відставаннями 12, 24, 36 ??).

    > bal2sum3years.ts
             Jan     Feb     Mar     Apr     May     Jun     Jul     Aug          
    2010 2540346 2139440 2218652 2176167 2287778 1861061 2000102 2560729 
    2011 3119573 2704986 2594432 2362869 2509506 2434504 2680088 2689888 
    2012 3619060 3204588 2800260 2973428 2737696 2744716 3043868 2867416 
             Sep     Oct     Nov     Dec
    2010 2232261 2394644 2468479 2816287
    2011 2480940 2699780 2760268 3206372
    2012 2951516 3119176 3032960 3738256

Модель, яку запропонував, auto.arima(bal2sum3years.ts)дала мені таку модель:

    Series: bal2sum3years.ts 
    ARIMA(0,0,0)(0,1,0)[12] with drift         

    Coefficients:
              drift
          31725.567
    s.e.   2651.693

    sigma^2 estimated as 2.43e+10:  log likelihood=-321.02
    AIC=646.04   AICc=646.61   BIC=648.39

Однак acf(bal2sum3years.ts,max.lag=35)коефіцієнти acf не перевищують 0,3. Однак сезонність даних є досить очевидною - сплеск на початку кожного року. Ось як виглядає серія на графіку: Оригінальний часовий ряд

Прогноз за fit=Arima(bal2sum3years.ts,seasonal=list(order=c(0,1,0),period=12),include.drift=TRUE)допомогою функцій, викликаних функцією forecast(fit), призводить до того, що значення наступних 12 місяців буде рівним останнім 12 місяців даних плюс постійні. Це можна побачити, зателефонувавши plot(forecast(fit)),

Фактичні та прогнозовані дані

Я також перевірив залишки, які не автокорельовані, але мають позитивне середнє значення (не нульове).

На мою думку, оригінальний часовий ряд точно не моделює (синій оригінальний часовий ряд, червоний - це fitted(fit):

Оригінальний vs fit

Здогадка, чи невірна модель? Я щось пропускаю? Як я можу вдосконалити модель? Здається, що модель буквально займає останні 12 місяців і додає константу для досягнення наступних 12 місяців.

Я відносний новачок у моделях прогнозування часових рядів та статистиці.


" Примітка не моделює оригінальний часовий ряд точно, на мій погляд " - чому б ви цього очікували ??
Glen_b -Встановити Моніку

@Glen_b, ця думка грунтувалася на відмінностях, які я бачу, коли дивлюся на сюжет. Якщо я намагаюся прогнозувати, наприклад, щомісячні продажі для цілей бухгалтерського обліку, помилка може бути значною ...
zima

" відмінності, які я бачу, коли я дивлюся на сюжет ", - це ще один спосіб сказати " не чітко моделює часовий ряд ". Це не суперечить. Ваше вираження бажання кращого прогнозу - це те саме бажання, яке має кожен синоптик. У багатьох випадках це може бути дуже важливо. Тим не менш, це бажання не містить більше інформації в дані. Кожна модель ARIMA - справді будь-яка модель часового ряду, що має відношення до цього завдання - має ненульовий термін помилки. Там буде завжди бути невідповідність між даними і посадкою. Чи є щось, що змушує вас думати, що ваша модель пропустила щось, що можна моделювати?
Glen_b -Встановити Моніку

Я щойно думав про щось .. Можливо, модель ARIMA справді не в змозі відобразити дані через не врахування характеру активності даних - користувача на веб-сайті. Я думаю, що можуть бути й інші події, що впливають на кількість, а не лише сезонність - наприклад, спеціальні події, акції. Я розберуся в цьому.
zima

Досить правдоподібно. Якщо це так, ви повинні мати можливість виявити такий збій у залишках. Зауважте, що як моделі ARIMA, так і структурні моделі часових рядів можуть включати в себе такі речі, як спеціальні заходи та акції за допомогою регресійних умов; регресійні моделі часових рядів є досить поширеними.
Glen_b -Встановити Моніку

Відповіді:


9

З моменту появи ваших даних, після розмежування сезонів, цілком може бути відсутнім істотна сезонність. Цей пік на початку кожного року, а подальший зразок протягом решти року досить добре підхопленийI[12]модель ; модель включила "очевидну сезонність".

Так, дійсно, запропонована модель "Цього червня = Останній червень + константа + помилка", і аналогічно для інших місяців.

Що конкретно з цим? Схоже, це чудовий опис ваших даних.

Ви можете виявити декомпозицію часових рядів більш інтуїтивно зрозумілою та простішою для пояснення, можливо, навіть щось, що базується на Базовій структурній моделі - модель із сезонністю, - але це не обов'язково означає модель, яка функціонує краще, ніж ту, яку ви маєте. Однак одна чи кілька стандартних методик розкладання, можливо, варто спробувати - можна сказати багато для моделі, яку ви добре розумієте.


1

Я вважаю, що наша проблема полягає в тому, що ми переходимо безпосередньо до моделі ARIMA, не пробуючи традиційні моделі. з цієї причини можна виявити, що модель не дає необхідних результатів. У вашому випадку, я перевірив ваші дані, я виявив, що сезонність відбувається кожні 12 місяців, що для вас зрозуміло, але також я виявив, що просте ковзаюче середнє значення в 3 строки Сезонне коригування: Мультипликативна - найкраща модель. На мою думку, ми повинні спробувати традиційні алгоритми прогнозування, перш ніж перейти до будь-якої передової техніки. Прогноз на 12 місяців для даних запитань


1
Модель, яку ви пропонуєте, - це модель ARIMA вигляду (3,0,0) (0,0,0), де ви жорстко кодуєте три коефіцієнти, що становлять .333, .333 та .333 та константу 0,0. Таким чином, ви не тільки приймаєте форму аріма-моделі, АЛЕ ви припускаєте значення коефіцієнтів ТА в ряді не існує видатків. Дозвольте, щоб дані говорили самі за формою моделі та оптимальними значеннями параметрів ... вам нічого втрачати і багато чого отримати. Якщо ваша модель справді правильна, то вона буде знайдена. Усі моделі аріма є зваженими функціями минулого.
IrishStat

1
stats.stackexchange.com/questions/40905/… пояснює , як пов'язане зважене моделювання та арима. Таким чином, модель ARIMA можна пояснити як відповідь на питання, скільки історичних значень я повинен використовувати для обчислення зваженої суми минуле? Які саме ці цінності?
IrishStat
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.