Чи є золотий стандарт для моделювання нерегулярно розташованих часових рядів?


45

У галузі економіки (я думаю) у нас є ARIMA та GARCH для регулярно розподілених часових рядів, а Пуассон, Хоукс для моделювання точкових процесів, тож як щодо спроб моделювання нерегулярних (нерівномірно) проміжок часу - чи існують (принаймні) загальні практики ?

(Якщо у вас є деякі знання з цієї теми, ви також можете розширити відповідну статтю у вікі .)

Видання (про пропущені значення та нерегулярні інтервали часу):

Відповідь на коментар @Lucas Reis Якщо проміжки між змінною вимірювань чи реалізацій розміщені через (наприклад) процесу Пуассона, для такого виду регуляризації немає багато місця, але існує проста процедура: t(i)чи i-й показник часу змінної x (i-й час реалізація x), потім визначаємо прогалини між часом вимірювань як g(i)=t(i)-t(i-1), тоді ми дискретизуємо, g(i)використовуючи константу c, dg(i)=floor(g(i)/cі створюємо новий часовий ряд з кількістю порожніх значень між старими спостереженнями від початкового часового ряду iі i+1рівним dg (i), але проблема полягає в тому, що це процедура може легко створити часовий ряд з кількістю відсутніх даних набагато більшим, ніж кількість спостережень, тому розумна оцінка значень відсутніх спостережень може бути неможливою і занадто великоюcвидалити "структуру часу / залежність від часу тощо" аналізованої проблеми (крайній випадок задається, приймаючи, c>=max(floor(g(i)/c))який просто згортає неправильно розташовані часові ряди на регулярно простір

Edition2 (просто для розваги): облік зображення пропущених значень у неправильно розташованих часових рядах або навіть у випадку точкового процесу.


Просто для уточнення, коли ви говорите "неправильно розташовані", ви не маєте на увазі "регулярно розташовані, але з пропущеними значеннями", правда?
Уейн

2
Ні :) t(i)- час, x[t(i)],x[t(i+1)],x[t(i+2)]...і t(j+1)-t(j)не є постійним. Дані збираються в розподіленій або асинхронній садибі.
Qbik


2
Що щодо інтерполяції та аналізу аналізу з інтерпольованими значеннями, регулярно розташованих між собою? Хтось знає, які будуть наслідки цього методу?
Лукас Рейс

Як щодо спочатку моделювання часу точок, а потім значень точок, що залежать від їх часу? Я вважаю, що термін "позначені точкові процеси" - це термін.
PeterR

Відповіді:


26

Якщо спостереження стохастичного процесу розташовані нерегулярно, найбільш природним способом моделювання спостережень є дискретні спостереження за часом від безперервного процесу часу.

X1,,Xnt1<t2<<tnXiXi1,,X1Xi1 Xi2,,X1 titi1titi1

titi1=1P1Ptiti1Pt

dXt=a(Xt)dt+b(Xt)dBt.
автор Стефано Якус. Можливо, багато методів та результатів описано для рівновіддалених спостережень, але це, як правило, просто зручно для презентації та не є суттєвим для застосування. Однією з головних перешкод є те, що специфікація SDE рідко допускає явну ймовірність, коли у вас є дискретні спостереження, але є добре розроблені альтернативи рівняння оцінки.

dXt=0ta(s)(XtXs)ds+σdBt
(p)

Я вважаю, що справедливо сказати, що загальною практикою роботи з спостереженнями в нерегулярні моменти часу є побудова безперервної стохастичної моделі часу.


1
GARCH не є процесом стохастичної мінливості. Обсяг у GARCH повністю визначається для цього періоду спостереженнями в попередні періоди.
Аксакал

11

Для нерегулярних інтервалів часу побудувати фільтр Кальмана легко .

Тут є документ про те, як перенести ARIMA у форму простору стану тут

(1)

(1)


Вибачте, я не маю доступу до цього останнього документу, чи можете ви мені допомогти?
Кварц

2
Я додав цитування, тому його легко знайти - тут також є препринт: eprints.soton.ac.uk/147383
bdecaf

Документ про перенесення ARIMA в простір станів, здається, має розрив зв'язку.
ofey73

9

Коли я шукав спосіб виміряти кількість коливань даних, що невірно вибираються, я натрапив на ці два документи про експоненціальне згладжування нерегулярних даних за допомогою Cipra [ 1 , 2 ]. Вони розвиваються далі на методах згладжування Брауна, Вінтерса і Хольта (див. Запис у Вікіпедії для Експоненціального згладжування ) та на іншому методі Райт (див. Довідку в статті). Ці методи не передбачають багато основного процесу, а також працюють для даних, що показують сезонні коливання.

Я не знаю, чи вважається це будь-яким «золотим стандартом». Для власних цілей я вирішив використовувати двостороннє (однократне) експоненціальне згладжування за методом Брауна. У мене з’явилася ідея двостороннього згладжування читання резюме до студентської праці (що я зараз не можу знайти).


7

Аналіз нерегулярно вибірених часових рядів може бути складним, оскільки не існує багато інструментів. Іноді практика полягає у застосуванні регулярних алгоритмів та сподіванні на краще. Це не обов'язково найкращий підхід. В інший час люди намагаються інтерполювати дані в прогалини. Я навіть бачив випадки, коли прогалини заповнюються випадковими числами, які мають такий же розподіл, як відомі дані. Один алгоритм, спеціально для нерегулярно відібраних серій, - це періодограма Lomb-Scargle, яка дає періодограму (мислимий спектр потужності) для нерівномірно вибірених часових рядів. Lomb-Scargle не вимагає будь-яких "кондиціонування".


3

Якщо ви хочете "локальну" модель часової області - на відміну від оцінки кореляційних функцій або спектрів потужності), скажіть, щоб виявити та охарактеризувати перехідні імпульси, стрибки тощо - тоді алгоритм блоку Байєса може бути корисним. Він забезпечує оптимальне кусково-постійне подання часових рядів у будь-якому режимі даних та з довільною (нерівномірно) віднесеною вибіркою. Побачити

"Дослідження астрономічного аналізу часових рядів. VI. Байєсівські блокові уявлення", Скаргл, Джеффрі Д.; Norris, Jay P .; Джексон, Бред; Чіанг, Джеймс, Астрофізичний журнал, Том 764, 167, 26 с. (2013). http://arxiv.org/abs/1207.5578


2

RJMartin, "Нерегулярні вибіркові сигнали: теорії та методи аналізу", кандидатська дисертація, UCL, 1998 р., Доступна в Інтернеті. У розділі 4 розглядаються авторегресивні моделі та розробляється тема з точки зору безперервного часу, як говорилося в інших публікаціях.


1

Розділ 4.10 Дж. Дурбіна, SJKoopman, Аналіз часових рядів за допомогою державних космічних методів , 2-е видання, 2012 р., Присвячено моделюванню за обставин відсутніх спостережень.


1

У просторовому аналізі даних дані більшу частину часу відбирають у просторі нерегулярно. Отож, однією ідеєю було б побачити, що там робиться, і здійснити оцінку варіограми, кригінг тощо тощо для одновимірної області "час". Варіограми можуть бути цікавими навіть для регулярно розміщених даних часових рядів, оскільки вони мають різні властивості від функції автокореляції, і визначаються та мають значення навіть для нестаціонарних даних.

Ось один папір (іспанською мовою) і ось ще один.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.