Як дізнатися, чи є часовий ряд стаціонарним чи нестаціонарним?


30

Я використовую R, я шукав на Google і з'ясував , що kpss.test(), PP.test()і adf.test()використовуються , щоб знати про стаціонарності часових рядів.

Але я не статистик, який може інтерпретувати їх результати

> PP.test(x)

     Phillips-Perron Unit Root Test
data:  x 
Dickey-Fuller = -30.649, Truncation lag parameter = 7, p-value = 0.01

> kpss.test(b$V1)

  KPSS Test for Level Stationarity
  data:  b$V1 
  KPSS Level = 0.0333, Truncation lag parameter = 3, p-value = 0.1

Warning message:
In kpss.test(b$V1) : p-value greater than printed p-value
> adf.test(x)

    Augmented Dickey-Fuller Test

data:  x 
Dickey-Fuller = -9.6825, Lag order = 9, p-value = 0.01
alternative hypothesis: stationary

Warning message:
In adf.test(x) : p-value smaller than printed p-value

Я маю справу з тисячами часових рядів, ласкаво розкажіть, як кількісно перевірити стаціонарність часових рядів.

Відповіді:


22

Тестування того, чи є ряд стаціонарним, а нестаціонарним, вимагає розглянути послідовність альтернативних гіпотез. По одному для кожного списку Гаусса Успіння Треба розуміти, що припущення Гаусса стосуються процесу помилок і не мають нічого спільного з оцінюваним рядом. Як правильно підсумовано StasK, це може включати порушення стаціонарності, такі як середня зміна, зміна дисперсії, зміни параметрів моделі з часом. Наприклад, висхідний тренд набору значень був би прикладом приклад серії, яка в Y не була постійною, тоді як залишки відповідної моделі можуть бути описані як такі, що мають постійне середнє значення. Таким чином, початковий ряд є нестаціонарним в середньому, але залишковий ряд нерухомий у середньому. Якщо в залишкових рядах є неврівноважені середні порушення, такі як імпульси, зміна рівня, сезонні імпульси та / або локальні тенденції часу, то залишковий ряд (необроблений) може бути охарактеризований як нестаціонарний в середньому, тоді як ряд змінних індикаторів може бути легко виявляється та включається в модель, щоб зробити залишки моделі в середньому нерухомими. Тепер, якщо дисперсія оригінальної серії демонструє нестаціонарну дисперсію, цілком доцільно обмежити фільтр / модель, щоб відобразити процес помилки, який має постійну дисперсію. Аналогічно, залишки в моделі можуть мати незмінні зміни, що вимагають одного з трьох можливих способів усунення - Сезонні імпульси та / або локальні тенденції часу, тоді залишковий ряд (необроблений) можна охарактеризувати як нестаціонарний в середньому, тоді як ряд змінних індикаторів можна легко виявити та включити в модель, щоб зробити залишки моделі нерухомими в середньому . Тепер, якщо дисперсія оригінальної серії демонструє нестаціонарну дисперсію, цілком доцільно обмежити фільтр / модель, щоб відобразити процес помилки, який має постійну дисперсію. Аналогічно, залишки в моделі можуть мати незмінні зміни, що вимагають одного з трьох можливих способів усунення - Сезонні імпульси та / або локальні тенденції часу, тоді залишковий ряд (необроблений) можна охарактеризувати як нестаціонарний в середньому, тоді як ряд змінних індикаторів можна легко виявити та включити в модель, щоб зробити залишки моделі нерухомими в середньому . Тепер, якщо дисперсія оригінальної серії демонструє нестаціонарну дисперсію, цілком доцільно обмежити фільтр / модель, щоб відобразити процес помилки, який має постійну дисперсію. Аналогічно, залишки в моделі можуть мати незмінні зміни, що вимагають одного з трьох можливих способів усунення - Тепер, якщо дисперсія оригінальної серії демонструє нестаціонарну дисперсію, цілком доцільно обмежити фільтр / модель, щоб відобразити процес помилки, який має постійну дисперсію. Аналогічно, залишки в моделі можуть мати незмінні зміни, що вимагають одного з трьох можливих способів усунення - Тепер, якщо дисперсія оригінальної серії демонструє нестаціонарну дисперсію, цілком доцільно обмежити фільтр / модель, щоб відобразити процес помилки, який має постійну дисперсію. Аналогічно, залишки в моделі можуть мати незмінні зміни, що вимагають одного з трьох можливих способів усунення -

  1. Найваговимі найменші квадрати (деякі аналітики широко не помічають)
  2. Перетворення потужності для від'єднання очікуваного значення від дисперсії помилок, виявлених за допомогою тесту Box-Cox та / або
  3. Необхідність моделі GARCH для обліку структури ARIMA, очевидної у квадратних залишках. Продовжуючи, якщо параметри змінюються з часом АБО форма моделі змінюється з часом, тоді виникає необхідність виявити цю характеристику та виправити її за допомогою сегментації даних або використання підходу TAR à la Tong.

34

ут=гріхт

ут=ут-1+ϵт
ут-2ут-3з малими коефіцієнтами). Це проста модель ефективного фінансового ринку, де жодна інформація не може бути використана для прогнозування майбутніх змін цін. Більшість економістів думають про свій часовий ряд як про моделі ARIMA; ці часові ряди мають чітко визначені періоди, коли трапляються речі (місяць, квартал чи рік), тому вони рідко стають гіршими, ніж для них інтегрований часовий ряд. Таким чином, ці тести не розроблені для більш складних порушень стаціонарності, таких як середня зміна, зміна дисперсії, зміна коефіцієнтів авторегресії тощо, хоча, очевидно, були розроблені і тести на ці ефекти.

У галузі інженерних чи природничих наук ви, швидше за все, стикаєтеся із тимчасовими рядами із складнішими проблемами, такими як залежність далекої дальності, дробова інтеграція, рожевий шум тощо. З відсутністю чітких вказівок з опису процесу щодо типових масштабів часу ( як часто змінюється клімат?), як правило, має більше сенсу аналізувати дані в частотній області (тоді як для економістів частотна область є цілком зрозумілою: існують щорічні сезонні цикли плюс триваліші тривалість бізнес-циклів 3-4-5 років ; мало несподіванок може статися інакше).

p0,05/(3М)М30,05ppp.test(x)$p.value


4

Часовий ряд є стаціонарним, якщо його середній рівень та дисперсія залишаються стійкими з часом. Ви можете ознайомитись з цією темою (із специфікацією відповідних тестів на R) у нашому пості. Http://www.statosphere.com.au/check-time-series-stationary-r/


1
Пізній коментар, але що ви маєте на увазі, що середнє значення та дисперсія залишаються стійкими з часом? Для даного набору даних середнє значення та дисперсія є такими, якими вони є, правда? Або ви маєте на увазі, що середнє значення / var для всіх підмножин даних має бути рівним?
Ерік Вестерлунд

2
Я подивився на пов’язану сторінку. Зазначається, що "Тест Люнг-Бокса вивчає наявність вагомих доказів ненульової кореляції у відставаннях 1-20. Малі значення p (тобто менше 0,05) дозволяють припустити, що серія є нерухомою". Висновок очевидно неправильний. Недоліком є ​​те, що спостереження є ідентичними. Відхилення нуля на основі невеликого p-значення вказує лише на те, що існує принаймні один значний відставання. Висновок на веб-сайті означав би, що стаціонарність вимагає значної автокореляції принаймні одного відставання. І це неправда.
random_guy
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.