Я практик, і виробник, і користувач прогнозування, і НЕ навчений статистик. Нижче я ділюсь своїми думками щодо того, чому ваш середній прогноз виявився кращим, ніж ARIMA, посилаючись на статтю дослідження, що спирається на емпіричні дані. Одна книга, яку знову і знову повертаюсь до згадки, - це книга " Принципи прогнозування " Армстронга та її веб-сайт, який я рекомендував би відмінне для читання будь-якому синоптику, який дає чудове розуміння використання та керівних принципів методів екстраполяції.
Щоб відповісти на ваше перше запитання - що я хочу знати, якщо це незвично?
Існує глава під назвою Екстраполяція даних часових рядів і міжсекційних, які також доступні безкоштовно на тому ж веб-сайті . Далі йде цитата з глави
"Наприклад, у змаганнях М2 в реальному часі, в яких було вивчено 29 щомісячних серій, Бокс-Дженкінс виявився одним із найменш точних методів, і його загальна медіанна помилка була на 17% більшою, ніж для наївного прогнозу"
Існує емпіричне підтвердження того, чому ваші середні прогнози були кращими, ніж моделі ARIMA.
Також було проведено дослідження після вивчення емпіричних змагань, і третій конкурс M3, який показує підхід Box - Jenkins ARIMA, не дає точного прогнозу і не має доказів того, що він працює краще для одновимірної екстраполяції тенденцій.
На цьому ж веб-сайті є ще одна стаття та триває дослідження Гріна та Армстронга під назвою " Просте прогнозування: уникайте сліз перед сном ". Автори статті підсумовують наступне:
Всього ми виділили 29 робіт, що містять 94 формальних порівняння точності прогнозів від складних методів із тими простими, але не у всіх випадках складними простими методами. Вісімдесят три відсотки порівнянь виявили, що прогнози від простих методів були більш точними, або аналогічно точними, ніж прогнози складних методів. В середньому помилки прогнозів від складних методів були приблизно на 32 відсотки більшими, ніж помилки прогнозів від простих методів у 21 дослідженні, які забезпечують порівняння помилок
Щоб відповісти на ваше третє запитання : чи це означає, що я щось не так налаштував? Ні, я б вважав ARIMA складним методом, а середній прогноз - простими методами. Існує багато доказів того, що прості методи, такі як Середній прогноз, перевершують складні методи, такі як ARIMA.
Щоб відповісти на ваше друге запитання : Чи означає це, що серія часу, яку я використовую, дивна?
Нижче наведено те, що я вважав експертами з прогнозування реального світу:
- Макрідакіс (Піонерська емпірична конкуренція з прогнозування під назвою M, M2 та M3, і проклала шлях для методів, що ґрунтуються на доказах у прогнозуванні)
- Армстронг (надає цінну інформацію у вигляді книг / статей з практики прогнозування)
- Гарднер (Експоненціальна згладжувана тенденція викритої тенденції - ще один простий метод, який дивно добре працює проти ARIMA)
Всі перераховані вище дослідники виступають за простоту (такі методи як ваш середній прогноз) порівняно зі складними методами, такими як ARIMA. Тож вам слід почувати себе комфортно, що ваші прогнози хороші та завжди віддавати перевагу простоті над складністю на основі емпіричних даних. Усі ці дослідники внесли величезний внесок у сферу прикладного прогнозування.
Окрім хорошого списку простого методу прогнозування Стефана. Існує також інший метод, який називається методом прогнозування Theta, який є дуже простим методом (в основному Просте Експоненціальне згладжування з дрейфом, що дорівнює 1/2 нахилу лінійної регресії), я додав би це до вашої панелі інструментів. Forecast package in R
реалізує цей метод.