Коли я вступаю в прогнозування за допомогою моделей ARIMA, я намагаюся зрозуміти, як я можу покращити прогноз на основі підходу ARIMA із сезонністю та дрейфом.
Мої дані - наступний часовий ряд (понад 3 роки, з чіткою тенденцією вгору та видимою сезонністю, яка, схоже, не підтримується автокореляцією з відставаннями 12, 24, 36 ??).
> bal2sum3years.ts
Jan Feb Mar Apr May Jun Jul Aug
2010 2540346 2139440 2218652 2176167 2287778 1861061 2000102 2560729
2011 3119573 2704986 2594432 2362869 2509506 2434504 2680088 2689888
2012 3619060 3204588 2800260 2973428 2737696 2744716 3043868 2867416
Sep Oct Nov Dec
2010 2232261 2394644 2468479 2816287
2011 2480940 2699780 2760268 3206372
2012 2951516 3119176 3032960 3738256
Модель, яку запропонував, auto.arima(bal2sum3years.ts)
дала мені таку модель:
Series: bal2sum3years.ts
ARIMA(0,0,0)(0,1,0)[12] with drift
Coefficients:
drift
31725.567
s.e. 2651.693
sigma^2 estimated as 2.43e+10: log likelihood=-321.02
AIC=646.04 AICc=646.61 BIC=648.39
Однак acf(bal2sum3years.ts,max.lag=35)
коефіцієнти acf не перевищують 0,3. Однак сезонність даних є досить очевидною - сплеск на початку кожного року. Ось як виглядає серія на графіку:
Прогноз за fit=Arima(bal2sum3years.ts,seasonal=list(order=c(0,1,0),period=12),include.drift=TRUE)
допомогою функцій, викликаних функцією forecast(fit)
, призводить до того, що значення наступних 12 місяців буде рівним останнім 12 місяців даних плюс постійні. Це можна побачити, зателефонувавши plot(forecast(fit))
,
Я також перевірив залишки, які не автокорельовані, але мають позитивне середнє значення (не нульове).
На мою думку, оригінальний часовий ряд точно не моделює (синій оригінальний часовий ряд, червоний - це fitted(fit)
:
Здогадка, чи невірна модель? Я щось пропускаю? Як я можу вдосконалити модель? Здається, що модель буквально займає останні 12 місяців і додає константу для досягнення наступних 12 місяців.
Я відносний новачок у моделях прогнозування часових рядів та статистиці.