За яких обставин підходить процес MA чи AR?


21

Я розумію, що якщо процес залежить від попередніх значень самого себе, то це процес AR. Якщо це залежить від попередніх помилок, то це процес МА.

Коли б сталася одна з цих двох ситуацій? Хтось має вагомий приклад, який висвітлює основну проблему щодо того, що означає процес, який найкраще змоделювати як МА проти АР?


3
Це не така проста дихотомія, як це; врешті-решт, AR може бути записаний як нескінченний MA, а (неперевернений) MA може бути записаний як нескінченний AR, так що якщо будь-коли це підходить, можливо, так це і інше.
Glen_b -Встановити Моніку

1
Glen_b, ти можеш детальніше розглянути це? Я розумію, що це не проста дихотомія ... чи правильно я припускаю (сподіваюся, навіть), що тут є щось, що варто розкрити? Я не хочу просто запускати acf / pacf і робити вигляд, що я добре розумію цей процес.
Метт О'Брайен

Відповіді:


10

Одним важливим і корисним результатом є теорема уявлення Уолда (іноді її називають декомпозицією Уолда), яка говорить про те, що кожен коваріаційно-стаціонарний часовий ряд може бути записаний як сума двох часових рядів, одного детермінованого та одного стохастичного.Yт

Yт=мкт+j=0бjεт-j , де є детермінованим.мкт

Другий термін - нескінченний МА.

(Так само буває, що обернений МА може бути записаний як нескінченний процес AR.)

Це говорить про те, що якщо ряд є коваріаційним , а якщо ми припускаємо, що ви можете визначити детерміновану частину, то ви завжди можете записати стохастичну частину як процес МА. Аналогічно, якщо MA задовольняє умову оберненості, ви завжди можете записати це як процес AR.

Якщо у вас процес написаний в одній формі, ви часто можете перетворити його в іншу форму.

Отже, в одному сенсі, для коваріаційних стаціонарних рядів часто доречні або AR, або MA.

Звичайно, на практиці ми б не мали дуже великих моделей. Якщо у вас є кінцевий AR або MA, і ACF, і PACF врешті-решт відпадають геометрично (є геометрична функція, абсолютне значення якої-небудь функції буде розташовуватися нижче), що, як правило, означає, що гарне наближення або AR, або Інститут магістрів в іншій формі часто може бути досить коротким.

Отже, в умовах стаціонарної коваріації та припускаючи, що ми можемо визначити детерміновані та стохастичні компоненти, часто і AR, і MA можуть бути доречними.

Методологія Box і Jenkins шукає парсимоніальну модель - модель AR, MA або ARMA з малою кількістю параметрів. Зазвичай ACF і PACF використовуються для спроби ідентифікації моделі, трансформуючи до стаціонарності (можливо, шляхом розмежування), ідентифікуючи модель від зовнішнього вигляду ACF та PACF (іноді люди використовують інші інструменти), підходять до моделі, а потім вивчають. структура залишків (як правило, через ACF і PACF на залишках), поки залишковий ряд не виявиться достатньо узгоджуваним з білим шумом. Часто буде кілька моделей, які можуть забезпечити розумне наближення до серії. (На практиці часто розглядаються інші критерії.)

Існують певні підстави для критики такого підходу. Для одного прикладу, p-значення, що є результатом такого ітераційного процесу, як правило, не враховують спосіб досягнення моделі (дивлячись на дані); наприклад, цього питання можна хоча б частково уникнути розбиттям зразків. Другий приклад критики - це складність фактичного отримання стаціонарного ряду - хоча в багатьох випадках можна перетворитись на отримання серії, яка здається розумно узгодженою з стаціонарністю, зазвичай це не буде так, як це є насправді (подібні питання є поширеними проблема зі статистичними моделями, хоча, можливо, іноді це може бути більше питанням).

[Взаємозв'язок між АР та відповідним нескінченним МА обговорюється у " Прогнозуванні Гіндмана та Атанасопулоса : принципи та практика , тут ]


1
-1 тому що, хоча це щось цікаво, він насправді не відповідає духу питання.
Джейк Вестфалл

Привіт Джейку - дякую за те, що ви додали коментар про те, що ви вважаєте неправильним у відповіді. Це набагато корисніше, ніж було б лише потворним життям. Я погоджуюсь, що тут чогось бракує - принаймні, слід уточнити, чому я вважаю, що це досить актуально, щоб опублікувати як відповідь.
Glen_b -Встановіть Моніку

1
@jake Я вніс кілька змін, які, сподіваюся, стануть більш чіткими для цього. Ще раз дякую за допомогу
Glen_b -Встановіть Моніку

Дякуємо за правки Я вилучив свій потік. Моя конденсація в одному реченні вашої переглянутої відповіді була б чимось на зразок: "На це питання важко відповісти взагалі, тому що у багатьох випадках модель AR або MA може відповідати даним приблизно так само, як і інші. " Що є законною, якщо невтішною, відповіддю на питання.
Джейк Вестфалл

@Jake не відчуває необхідності видаляти протокол, якщо у вас все ще є застереження; Я ціную шанс покращити відповідь у будь-якому випадку.
Glen_b -Встановити Моніку

5

Я можу надати вагому відповідь на першу частину питання ("звідки М.А."), але в даний час розмірковую про однаково переконливу відповідь на другу частину питання ("звідки АР?").

Розглянемо серію, що складається з ціни закриття (скоригованої на розбиття та дивіденди) акції протягом днів поспіль. Ціна закриття кожного дня походить від тенденції (наприклад, лінійної за часом) плюс зважених ефектів щоденних потрясінь за попередні дні. Імовірно, ефект шоку в день t-1 матиме сильніший вплив на ціну в день t, ніж шок в день t-2 і т. Д. Таким чином, логічно, ціна закриття акцій в день t відображатиме тенденцію значення в день t плюс константа (менше 1) кратна від зваженої суми потрясінь за день t-1 (тобто, термін помилки в день t-1) (MA1), можливо плюс константа (менше 1) в рази більше зваженої суми потрясінь за день t-2 (тобто термін помилки в день t-2) (MA2), ..., плюс новий ударний удар в день t (білий шум). Така модель виглядає підходящою для моделювання таких серій, як фондова біржа, де термін помилки в день t являє собою зважену суму попередніх та поточних потрясінь та визначає процес МА. Я працюю через не менш переконливе обґрунтування для виключно AR-процесу.


3
+1. Це єдина відповідь на даний момент, що навіть намагаються відповісти на початкове запитання.
С. Коласа - Відновіть Моніку

Якщо я правильно це розумію, це здається, що процес AR краще для виправлення повторюваних тенденцій, але MA краще для виправлення великих, неповторних поштовхів.
Майк Кемпбелл

0

Це найпростіший приклад, який я міг би придумати, щоб допомогти візуалізувати процеси AR, MA та ARMA.

Зауважте, що це лише наочний посібник для вступу до теми і аж ніяк не досить жорсткий, щоб врахувати всі можливі випадки.

Припустимо наступне: У змаганнях у нас є два агенти, яким доручено виконати певний вид дій (стрибнути горизонтально вправо).

  1. В середньому очікується, що "Людина" буде долати відстань "μ" зі стандартним відхиленням "𝛿" з кожним стрибком відповідно до його фізичної можливості. Однак людині особливо не вистачає душевної стійкості :), і його продуктивність також залежить від того, чи минулий стрибок відстав / зустрівся / перевищив його очікування.

  2. "Машина" була розроблена за такими ж характеристиками, що і вищезгадана людина, лише з однією різницею - машина не викликає емоцій і не впливає на минулі виступи.

Крім того, є дві гри, які повинні грати обидва агенти з кожною грою, що включає два стрибки:

  1. «Фінальний стрибок» оцінюється на основі відстані, пройденої у фінальному стрибку після розминки, результат якого в змаганнях ігнорується, але доступний для спостереження людини. Фінальний стрибок починається там, де починається стрибок розминки.

  2. "Комбінований стрибок" забивається на основі комбінованої дистанції, пройденої в початковому та заключному стрибках. Фінальний стрибок починається там, де приземлений стрибок.

На графіку нижче показано, яка модель найкраще описує кожен із чотирьох сценаріїв, пов’язаних із вищевказаними акторами та іграми.

Діаграма, що описує відмінності між процесами AR, MA та ARMA


Цей плакат потребує певного пояснення та контексту, щоб бути зрозумілим. Чи можете ви сказати про це у своїй відповіді?
whuber

-1

Отже, у вас є універсальний часовий ряд, і ви хочете його моделювати / прогнозувати, правда? Ви вирішили використовувати модель типу ARIMA.

Параметри залежать від того, що найкраще підходить для вашого набору даних. Але як це дізнатися? Нещодавній підхід - "Автоматичне прогнозування часових рядів" Hyndman & Khandakar (2008) ( pdf ).

Алгоритм пробує різні версії p, q, P і Q і вибирає найменший AIC, AICc або BIC. Вона реалізована у функції auto.arima () з прогнозного пакета R . Вибір інформаційного критерію залежить від того, які параметри ви передаєте функції.

Для лінійної моделі вибір моделі з найменшим AIC може бути еквівалентним перехресній валідації "один-один".

Ви також повинні переконатися, що у вас є достатньо даних, принаймні чотири роки.

Деякі важливі перевірки:

  1. Чи має модель сенс? Наприклад, якщо у вас є щомісячні роздрібні продажі, ви, ймовірно, очікуєте, що сезонна модель підійде.
  2. Наскільки добре він прогнозується з вибірки?

Відверта відповідь на коментар Firebug нижче: Коли ваші дані це підтримують.


3
Ця відповідь взагалі не відповідає на питання:"My question is, when would one of either of these two situations occur? "
Firebug

1
"Явна відповідь на коментар Firebug нижче: Коли ваші дані це підтримують." Я погоджуюся з @Firebug - це не відповідь на питання і, безумовно, не є надійним прикладом для розмежування двох ...
Томас

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.