У мене є модель прогнозування для часового ряду, і я хочу обчислити її помилку передбачення поза вибіркою. На даний момент стратегія, яку я дотримуюсь, - це та, запропонована в блозі Роб Хайндмана (внизу сторінки), яка йде так (припускаючи часовий ряд та навчальний набір розміром k )
- Встановіть модель на даних і нехай у т + до бути прогноз для наступного спостереження.
- Підрахувати помилка прогнозу як .
- Повторіть для
- Обчисліть середню квадратичну помилку як
Моє запитання - скільки я маю турбуватися про кореляції через мінливі навчальні набори. Зокрема, кажуть , що я хочу , щоб прогнозувати не тільки в такому значенні, але наступні значення, так що у мене є прогнозів у т + K , ... , у т + до + т - 1 і помилки е т , 1 , ... , e t , m , і я хочу побудувати термінову структуру помилок прогнозування.
Чи можу я все-таки прокручувати вікно тренінгу, що рухається вперед на 1, або я повинен перекидати його на ? Як змінюються відповіді на ці питання, якщо є значна автокореляція в серії, яку я прогнозую (можливо, це процес довгої пам’яті, тобто функція автокореляції розпадається як закон потужності, а не експоненціально.)
Я вдячний або поясненням тут, або посиланням на те, де я можу знайти теоретичні результати щодо довірчих інтервалів навколо MSE (або інших заходів помилок).