Вітаємо, ви знайшли помилку. Прогноз для dynlm
нових даних порушується, якщо використовуються відсталі змінні. Щоб зрозуміти, чому дивіться на вихід
predict(model)
predict(model,newdata=data)
Результати повинні бути однаковими, але вони не є. Без newdata
аргументу predict
функція в основному захоплює model
елемент з dynlm
виводу. З newdata
аргументом predict
намагається сформувати нову модель матрицю з newdata
. Оскільки це включає формулу розбору, що подається, dynlm
і формула має функцію L
, яка визначена лише внутрішньо у функції dynlm
, формується матрична неправильна модель. Якщо ви спробуєте налагодити помилку, ви побачите, що залежна змінна величина не відстає у випадку подання newdata
аргументу.
Що ви можете зробити - це відставати залежну змінну і включати її в newdata
. Ось код, що ілюструє такий підхід. Я використовую set.seed
так, що це було б легко відтворюваним.
library(dynlm)
set.seed(1)
y<-arima.sim(model=list(ar=c(.9)),n=10) #Create AR(1) dependant variable
A<-rnorm(10) #Create independant variables
B<-rnorm(10)
C<-rnorm(10)
y<-y+.5*A+.2*B-.3*C #Add relationship to independant variables
data=cbind(y,A,B,C)
#Fit linear model
model<-dynlm(y~A+B+C+L(y,1),data=data)
Ось помилка поведінки:
> predict(model)
2 3 4 5 6 7 8 9 10
3.500667 2.411196 2.627915 2.813815 2.468595 1.733852 2.114553 1.423225 1.470738
> predict(model,newdata=data)
1 2 3 4 5 6 7 8 9 10
2.1628335 3.7063579 2.9781417 2.1374301 3.2582376 1.9534558 1.3670995 2.4547626 0.8448223 1.8762437
Формуйте newdata
#Forecast fix.
A<-c(A,rnorm(1)) #Assume we already have 1-step forecasts for A,B,C
B<-c(B,rnorm(1))
C<-c(C,rnorm(1))
newdata<-ts(cbind(A,B,C),start=start(y),freq=frequency(y))
newdata<-cbind(lag(y,-1),newdata)
colnames(newdata) <- c("y","A","B","C")
Порівняйте прогноз із підходом до моделі:
> predict(model)
2 3 4 5 6 7 8 9 10
3.500667 2.411196 2.627915 2.813815 2.468595 1.733852 2.114553 1.423225 1.470738
> predict(model,newdata=newdata)
1 2 3 4 5 6 7 8 9 10 11
NA 3.500667 2.411196 2.627915 2.813815 2.468595 1.733852 2.114553 1.423225 1.470738 1.102367
Як видно з історичних даних, прогноз збігається, і останній елемент містить прогноз на 1 крок вперед.
dynlm
пакету не дасть прогнозів для залежних змінних. Для надання прогнозів для залежних змінних потрібна модель для їх пояснення та, ймовірно, додаткових даних. Я пропоную вам прочитати щось про багатоваріантну регресію, наприклад, "Прикладний багатоваріантний статистичний аналіз" Джонсона та Вічерн. або курс з прогнозування: duke.edu/~rnau/411home.htm