Мені потрібно автоматизувати прогнозування часових рядів, і я не знаю заздалегідь особливості цих серій (сезонність, тенденція, шум тощо).
Моя мета - не отримати найкращу можливу модель для кожної серії, а уникнути досить поганих моделей. Іншими словами, отримувати невеликі помилки кожен раз - не проблема, але отримувати великі помилки раз у раз - це є.
Я думав, що зможу досягти цього, комбінуючи моделі, розраховані з різними методиками.
Тобто, хоча ARIMA був би найкращим підходом для конкретної серії, це може бути не найкращим для іншої серії; те ж саме для експоненціального згладжування.
Однак, якщо я поєднаю одну модель з кожної техніки, навіть якщо одна модель не дуже хороша, інша наблизить оцінку до реальної вартості.
Загальновідомо, що ARIMA краще працює для довготривалих добре керованих серій, тоді як експоненціальне згладжування виділяється короткочасними галасливими серіями.
- Моя ідея - поєднувати моделі, сформовані з обох методик, щоб отримати більш надійні прогнози, чи є сенс?
Можливо, існує багато способів комбінувати ці моделі.
- Якщо це хороший підхід, як я повинен їх поєднувати?
Просте середнє значення прогнозів - це варіант, але, можливо, я міг би отримати кращі прогнози, якби зважувати середню згідно з якоюсь мірою корисності моделі.
- Якою була б обробка дисперсії при поєднанні моделей?