Я хотів би поєднати прогнозовані та зворотні (тобто прогнозовані минулі значення) даних часового ряду, встановлені в один часовий ряд, мінімізуючи Помилку середнього квадратичного прогнозування.
Скажімо, у мене є часові ряди 2001-2010 рр. З розривом на 2007 рік. Мені вдалося прогнозувати 2007 р., Використовуючи дані 2001-2007 рр. (Червона лінія - так це називається ), і відмовити за допомогою даних 2008-2009 (світло синя лінія - назвіть це ).
Я хотів би об'єднати точки даних і в імпутовану точку даних Y_i за кожен місяць. В ідеалі я хотів би отримати вагу таку, щоб вона мінімізувала середньоквадратичну помилку передбачення (MSPE) . Якщо це неможливо, як би я просто знайшов середнє значення між двома точками даних часових рядів?
Як короткий приклад:
tt_f <- ts(1:12, start = 2007, freq = 12)
tt_b <- ts(10:21, start=2007, freq=12)
tt_f
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
2007 1 2 3 4 5 6 7 8 9 10 11 12
tt_b
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
2007 10 11 12 13 14 15 16 17 18 19 20 21
Я хотів би отримати (просто показуючи усереднення ... Ідеально мінімізуючи MSPE)
tt_i
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
2007 5.5 6.5 7.5 8.5 9.5 10.5 11.5 12.5 13.5 14.5 15.5 16.5
predict
функції пакету прогнозу. Однак я думаю, що я буду використовувати модель прогнозування HoltWinters для прогнозування та зворотної передачі. У мене є часові ряди, що мають менше <50 підрахунків, і я намагався прогнозувати регресію Пуассона - але чомусь дуже слабкі прогнози.
NA
значень? Складається враження, що створення періоду навчання MSPE може ввести в оману, оскільки підпериоди добре описуються лінійними тенденціями, але у пропущений період десь відбувається падіння, і насправді це може бути будь-який момент. Зауважимо також, що оскільки прогнози є колінеарними в тренді, їх середнє значення введе два структурні перерви замість, здавалося б, одного.