Чому часовий ряд повинен бути нерухомим?


92

Я розумію, що стаціонарний часовий ряд - це той, середнє значення та дисперсія якого постійні у часі. Чи може хтось пояснити, чому ми маємо переконатися, що наш набір даних є нерухомим, перш ніж ми можемо на ньому запускати різні моделі ARIMA або ARM? Чи це стосується також звичайних регресійних моделей, де автокореляція та / або час не є фактором?


2
Що таке моделі ARM? Ви мали на увазі ARMA?
mpiktas

9
Стаціонарність вимагає більше ніж постійне середнє значення та дисперсію. Слабка стаціонарність вимагає, щоб коваріаційна функція не залежала від . tcov(Xt,Xt+h)t
mpiktas

11
Вам не потрібно стационарность для запуску AR моделі MA, так як якщо порядок , це явно нестаціонарні. Однак, стаціонарність є припущенням ARMA. I ( ) > 0II()>0
Glen_b

1
+1 для коментаря до замовлення, хоч і суворо, це лише в тому випадку, якщо замовлення у . Для довільних замовлень є ARFIMA{ 0 , 1 , 2 , . . . }I{0,1,2,...}
кон'югатпріор

@Glen_b Чи можна застосовувати моделі ARIMA для будь-яких нестаціонарних серій? Або є якісь конкретні нестаціонарні випадки, у яких застосовується ARIMA?
Нізар

Відповіді:


75

Стаціонарність - це один тип структури залежності.

Припустимо, у нас є дані . Найбільш основне припущення полягає в тому, що є незалежними, тобто ми маємо вибірку. Незалежність - це приємна властивість, оскільки, використовуючи її, ми можемо отримати багато корисних результатів. Проблема полягає в тому, що іноді (або часто, залежно від виду) ця властивість не відповідає.X1,...,XnXi

Зараз незалежність є унікальною властивістю, дві випадкові змінні можуть бути незалежними лише одним способом, але можуть залежати різними способами. Отже, стаціонарність - це один із способів моделювання структури залежності. Виявляється, що багато непоганих результатів, які стосуються незалежних випадкових змінних (закон великих чисел, центральна гранична теорема, щоб назвати кілька), мають місце для стаціонарних випадкових величин (слід чітко говорити послідовностей). І звичайно виявляється, що багато даних можна вважати нерухомими, тому концепція стаціонарності дуже важлива при моделюванні незалежних даних.

Коли ми визначили, що у нас є стаціонарність, природно, ми хочемо її моделювати. Тут з'являються моделі ARMA. Виявляється, будь-які стаціонарні дані можна наблизити до стаціонарної моделі ARMA, завдяки теоремі про розкладання Уолда . Ось чому моделі ARMA дуже популярні, і саме тому нам потрібно переконатися, що серія є нерухомою для використання цих моделей.

Тепер знову така ж історія стосується незалежності та залежності. Стаціонарність визначається однозначно, тобто дані стаціонарні чи ні, тому існує лише спосіб, щоб дані були стаціонарними, але існує безліч способів, щоб вони були нестаціонарними. Знову виявляється, що багато даних стають нерухомими після певної трансформації. Модель ARIMA - це одна модель для нестаціонарності. Він передбачає, що дані стають нерухомими після розмежування.

У регресійному контексті стаціонарність важлива, оскільки ті самі результати, які застосовуються для незалежних даних, дотримуються, якщо дані стаціонарні.


4
Я б запропонував вам поставити цю частину вашої відповіді ("Тут надходять моделі ARMA. Виявляється, будь-які стаціонарні дані можна наблизити до стаціонарної моделі ARMA, завдяки теоремі про деформацію Wold. Отож, моделі ARMA дуже популярний, і саме тому нам потрібно переконатися, що серія є нерухомою для використання цих моделей. ") жирним шрифтом, оскільки саме це в першу чергу відповідає на питання.
Poete Maudit

34

Які кількості нас зазвичай цікавлять, коли ми проводимо статистичний аналіз за часовим рядом? Ми хочемо знати

  • Його очікуване значення,
  • Її дисперсія та
  • Кореляція між значеннями періодів, крім набору значень .sss

Як ми обчислюємо ці речі? Використання середнього значення протягом багатьох періодів часу.

Середнє значення протягом багатьох періодів часу є лише інформативним, якщо очікуване значення однакове протягом цих періодів часу. Якщо ці параметри сукупності можуть змінюватися, що ми дійсно оцінюємо, беручи середній показник за час?

(Слабка) стаціонарність вимагає, щоб ці кількості населення були однаковими протягом часу, що робить вибірку середньої вибірки розумним способом їх оцінки.

Крім цього, стаціонарні процеси уникають проблеми помилкової регресії .


12

Основна ідея статистичного навчання полягає в тому, що ви можете дізнатися, повторивши експеримент. Наприклад, ми можемо продовжувати гортати палець, щоб дізнатись про ймовірність того, що палець впаде на голову.

У контексті часових рядів ми спостерігаємо одинарний процес стохастичного процесу, а не повторний цикл стохастичного процесу. Ми спостерігаємо 1 довгий експеримент, а не кілька незалежних експериментів.

Нам потрібна стаціонарність та ергодичність, щоб спостереження за тривалим процесом стохастичного процесу було подібним до спостереження за багатьма незалежними ходами стохастичного процесу.

Деякі (неточні) визначення

Ω{Yt}t{1,2,3,}ωΩ

  • tYtΩ
  • ωX(ω){Y1(ω),Y2(ω),Y3(ω),}

Фундаментальне питання у часових рядах

X1X2X3i=1,,nωiΩX1ni=1nXiE[X]

tΩ

1Tt=1TYt

Для багаторазових спостережень у часі, щоб виконати подібне завдання, як декілька малюнків із зразкового простору , нам потрібна стаціонарність та ергодичність .

E[Y]1Tt=1TYtE[Y]

Приклад 1: збій стаціонарності

{Yt}Yt=t{Yt}

St=1ti=1tYiSttS1=1,S2=32,S3=2,,St=t+12YtStt

Приклад: збій ергодичності

XYt=Xt{Yt}=(0,0,0,0,0,0,0,){Yt}=(1,1,1,1,1,1,1,

E[Yt]=12St=1ti=1tYiYt


10

Щоб додати відповідь високого рівня до деяких інших відповідей, які є хорошими, але більш детальними, важливо стаціонарність, оскільки за його відсутності модель, що описує дані, буде відрізнятися точністю в різні моменти часу. Таким чином, необхідна стаціонарність для вибіркової статистики, такої як засоби, відхилення та кореляції, щоб точно описати дані в усі моменти часу, що представляють інтерес.

600<t<800200<t<400

введіть тут опис зображення


8

xt=xt1+et

Однак ми часто шукаємо стаціонарність. Чому?

Розглянемо проблему прогнозування. Як ви прогнозуєте? Якщо завтра все по-іншому, то неможливо прогнозувати, бо все буде по-іншому. Тому ключовим для прогнозування є пошук того, що буде таким же завтра, і продовження цього до завтра. Що щось може бути чим завгодно. Наведу кілька прикладів.

etN(0,σ2)σ2Δxtxtxt1=etΔxt

xt=αt+etE[et]=0α

Для прогнозування нам абсолютно потрібно знайти постійний (інваріантний за часом) компонент у ряді, інакше неможливо передбачити визначення. Стаціонарність - це лише окремий випадок інваріантності.


5

Оскільки ARIMA регресує на собі здебільшого, вона використовує тип самоіндукованої множинної регресії, на яку непотрібно впливати б сильна тенденція чи сезонність. Ця методика множинної регресії заснована на попередніх значеннях часових рядів, особливо на останніх періодах, і дозволяє нам отримати дуже цікавий "взаємозв'язок" між кількома минулими значеннями, які працюють для пояснення майбутнього значення.


2

X(Xt+1,,Xt+k)(X1,,Xk)tk. З Вікі: стаціонарний процес (або суворий (лі) стаціонарний процес або сильний (лі) стаціонарний процес) - це стохастичний процес, спільний розподіл ймовірностей якого не змінюється при зміщенні у часі чи просторі. Отже, такі параметри, як середнє значення та дисперсія, якщо вони існують, також не змінюються з часом чи положенням. Крім того, як Кардинал правильно вказав нижче, функція автокореляції повинна бути інваріантною в часі (що означає, що коваріаційна функція є постійною протягом часу) перетворюється на параметри моделі ARMA, які є інваріантними / постійними протягом усіх часових інтервалів.

Ідея стаціонарності моделі ARMA тісно пов'язана з ідеєю оберненості.

y(t)=1.1y(t1)(11.1B)


1
X

Згадка про стаціонарний номер другого порядку, здається, втрачена у вашій останній редакції. Це було навмисно? (Мій оригінальний коментар був більше спрямований на стаціонарність другого порядку, ніж на сувору стаціонарність.)
кардинал

: кардинал. Я думаю, я відчув, що ваш коментар важливий, і ясніше ставлюся до того, що передбачається. Якщо ви думаєте, що ідея "стаціонарного другого порядку" додає ясності, будь ласка, допоможіть мені додати її до моєї відповіді таким чином, що проливає світло простою англійською мовою.
IrishStat

-2

ARMA та ARIMA побудовані з припущенням, що серія нерухома. Якщо серії не буде, то прогноз буде неправильним.

Зразкова статистика - середня, дисперсійна, співвідміна - корисна як дескриптори майбутньої поведінки, лише якщо серія є нерухомою. Наприклад, якщо з часом послідовно збільшується серія, середня величина і дисперсія вибірки зростатимуть із розміром вибірки, і вони завжди занижуватимуть середнє значення та дисперсію в наступних періодах. Важливо бути обережними, намагаючись екстраполювати регресійні моделі, пристосовані до нестаціонарних даних.


-3

На мій погляд, стохастичний процес - це процес, керований трьома статистичними властивостями, які повинні бути неінваріантними за часом. Вони є середньою дисперсією та функцією автоматичної кореляції. Хоча перші два не розповідають про еволюцію процесу в часі, слід враховувати третє властивість, яка є функцією автокореляції, яка говорить про те, як залежність залежає в міру протікання часу (відставання).


5
Це плутає стохастичний процес і є нерухомим, тому він починається з принципової помилки. Що ваша відповідь додає до вже опублікованих?
Нік Кокс

-3

Щоб вирішити що-небудь, нам потрібно моделювати рівняння математично, використовуючи статику.

  1. Для вирішення таких рівнянь воно має бути незалежним та нерухомим (не рухається)
  2. Лише за стаціонарними даними ми можемо отримувати уявлення та робити математичні операції (середнє значення, дисперсію тощо) для багатоцільових
  3. У нестаціонарних умовах важко отримати дані

У процесі конверсії ми отримаємо тенденцію та сезонність


2
Жодна з ваших відповідей не має сенсу. Попередження питання неправильне. Багато часових рядів можна вважати нестаціонарними як теоретично, так і спостережно. Наприклад, існує багато методів для вирішення цього питання! розрізнення або сезонне розрізнення серії або 2. включаючи циклічні компоненти, такі як синусоїда.
Майкл Черник

@MichaelChernick Під час розмежування та сезонного розмежування ми перетворюємо нестаціонарні ряди в стаціонарні. Я погоджуюся з вашою думкою, що багато часових рядів є нестаціонарними, але щоб вирішити це математично, нам потрібно перетворити його на стаціонарне одне право
сараванан-саманітан
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.