Середньосуперечні терміни помилки моделі


17

Це основне питання щодо моделей Box-Jenkins MA. Як я розумію, модель MA - це в основному лінійна регресія значень часових рядів проти попередніх термінів помилки . Тобто спостереження спочатку регресується проти його попередніх значень а потім одне або більше значень використовуються як терміни помилки для MA модель.е т , . . . , Е т - п У У т - 1 , . . . , У т - п У - УYet,...,etnYYt1,...,YtnYY^

Але як обчислюються умови помилки в моделі ARIMA (0, 0, 2)? Якщо модель MA використовується без авторегресивної частини і, таким чином, без оціночного значення, то як я можу мати термін помилки?


1
Ні, я думаю, ви плутаєте визначення моделі MA (n), де регресія є лише з точки зору eti 's, з її оцінкою, де eti ' s оцінюється з даних .
Сіань

1
Основна проблема вашого запитання полягає в тому, що ви говорите, що модель MA в основному є лінійною регресією. Це просто не відповідає дійсності, оскільки ми не дотримуємось помилок.
mpiktas

Я думаю , що термін помилка є на самому справі YtYt^ , де Y є E ( Y | Y т , . . . , Т - п ) або просто Y т - Y т - 1 . Ось чому оцінка параметрів моделі МА виходить із повторюваної картини у функції часткової автокореляції Y , тобто поведінки залишків. Оцінка параметра AR замість цього базується на повторюваному шаблоні acf (Y).Y^E(Y|Yt,...,tn)YtYt1Y
Роберт Кубрик

Відповіді:


20

Оцінка моделі MA:

Припустимо серію зі 100 часовими точками і скажемо, що для неї характерна модель MA (1) без перехоплення. Тоді модель задається

yt=εtθεt1,t=1,2,,100(1)

Термін помилки тут не спостерігається. Отже, щоб отримати це, Box et al. Аналіз часових рядів: прогнозування та контроль (3-е видання) , сторінка 228 , припускають, що термін помилки обчислюється рекурсивно,

εt=yt+θεt1

Отже, термін помилки для є, ε 1 = y 1 + θ ε 0 Тепер ми не можемо обчислити це, не знаючи значення θ . Отже, щоб отримати це, нам потрібно обчислити Початкову або Попередню оцінку моделі, див. Box et al. зазначеної книги, в розділі 6.3.2 на сторінці 202 зазначено,t=1

ε1=y1+θε0
θ

Показано, що перші автокореляції процесу MA ( q ) є ненульовими і можуть бути записані в параметри моделі як ρ k = - θ k + θ 1 θ k + 1 + θ 2 θ k + 2 + + θ q - k θ qqq Вираз вище для р 1 , ρ 2, ρ д в термінах & thetas ; 1 , θ 2 , , θ д , поставки Q рівнянь в д невідомих. Попередні оцінки θ s може бути отримано шляхом підстановки оцінки г K для р до увище рівнянні

ρk=θk+θ1θk+1+θ2θk+2++θqkθq1+θ12+θ22++θq2k=1,2,,q
ρ1,ρ2,ρqθ1,θ2,,θqqqθrkρk

Зауважимо, що - передбачувана автокореляція. У розділі 6.3 - Початкові кошторисні параметри є додаткові обговорення , будь ласка, прочитайте їх. Тепер, припускаючи, що ми отримаємо початкову оцінку θ = 0,5 . Тоді ε 1 = y 1 + 0,5 ε 0 Тепер ще одна проблема полягає в тому, що у нас немає значення для ε 0, оскільки t починається з 1, і тому ми не можемо обчислити ε 1 . На щастя, є два способи отримати це,rkθ=0.5

ε1=y1+0.5ε0
ε0tε1
  1. Умовна ймовірність
  2. Беззастережна ймовірність

За даними Box et al. У розділі 7.1.3, сторінка 227 , значення можна замінити на нуль як апроксимацію, якщо n помірний або великий, цей спосіб є умовною вірогідністю. В іншому випадку використовується безумовна ймовірність, де значення ε 0 отримують за допомогою зворотного прогнозування, Box et al. рекомендуємо цей метод. Детальніше про попереднє прогнозування читайте в розділі 7.1.4 на сторінці 231 .ε0nε0

Отримавши початкові оцінки та значення , тоді нарешті ми можемо приступити до рекурсивного обчислення терміна помилки. Тоді завершальним етапом є оцінка параметра моделі ( 1 ) , пам’ятайте, це вже не попередня оцінка.ε0(1)

Оцінюючи параметр , я використовую процедуру нелінійної оцінки, зокрема алгоритм Левенберга-Маркарда, оскільки моделі MA нелінійні за його параметром.θ

Загалом, я б дуже рекомендував вам прочитати Box et al. Аналіз часових рядів: прогнозування та контроль (3-е видання) .


rk

4

Yt=i=1qϑieti+σet,etiidN(0,1)
q

1
etetq

1
Чому у вашій формулі є мінус? Зазвичай мінус для моделей AR. Математично це не проблема, мені просто цікаво, оскільки я ніколи не бачив мінусів у моделях MA.
mpiktas

3
@RobertKubrick, чи знаєте ви теорему про розкладання Уолда ? Кожен стаціонарний процес має відповідний інноваційний процес, тобто звідки терміниетприйти.
mpiktas

1
@mpiktas Дякую, це дає деяку інформацію про термін помилки, але мені все ще не зрозуміло, звідки відбувається інноваційний процес, щоб інновація існувала, десь повинен бути прогноз ( en.wikipedia.org/wiki/Innovation_ ( сигнал_обробка) ). Є оптимальнимY прогноз просто Е(Y), це середина серії?
Роберт Кубрик

1

Ви кажете «спостереження Y вперше регресує проти своїх попередніх значень Yt1,...,Ytn and then one or more YY^ values are used as the error terms for the MA model." What I say is that Y is regressed against two predictor series et1 and et2 yielding an error process et which will be uncorrelated for all i=3,4,,,,t .We then have two regression coefficients: θ1 representing the impact of et1 and θ2 representing the impact of et2. Thus et is a white noise random series containing n-2 values. Since we have n-2 estimable relationships we start with the assumption that e1 and e2 are equal to 0.0 . Now for any pair of θ1 and θ2 we can estimate the t-2 residual values. The combination that yields the smallest error sum of squares would then be the best estimates of θ1 and θ2.


What are the 2 other predictor series? I am asking because when I look at the literature I have it's never clearly specified. Are these 2 other series unrelated to Y? I had the impression that all ARIMA formulation is limited to the Y series.
Robert Kubrick

1
The 2 predictors are the lags of the error terms. Since these are not known a priori since we do not know the error terms before we begin is why this has to be treated by non-linear estimation.The confusion you are having is that a model that is finite in the past ( i.e. an AR MODEL ) is potentially infinite in the errors AND a model that is finite in the errors ( i.e. an MA MODEL) is potentially infinite in the past of Y.The reason one selects an AR MODEL versus an MA MODEL is for parsimony. Sometimes we construct an ARMA MODEL which blends both the history of Y and the history of the errors.
IrishStat

1
As I commented in the other answer, what I am still missing is what's the optimal forecast for Y, which is used to calculate the innovation etn.
Robert Kubrick

1

See my post here for an explanation of how to understand the disturbance terms in a MA series.

You need different estimation techniques to estimate them. This is because you cannot first get the residuals of a linear regression and then include the lagged residual values as explanatory variables because the MA process uses the residuals of the current regression. In your example you are making two regression equations and using residuals from one into the other. This is not what an MA process is. It cannot be estimated with OLS.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.