У літературі я знайшов два визначення щодо часу автокореляції слабо нерухомого часового ряду:
де - автокореляція в відстані .
Одним із застосувань часу автокореляції є пошук "ефективного розміру вибірки": якщо у вас є спостережень за тимчасовим рядом, і ви знаєте його час автокореляції , ви можете зробити вигляд, що у вас є
незалежні вибірки замість співвідносних з метою знаходження середнього. Оцінка даних за даними нетривіальна, але є кілька способів зробити це (див. Thompson 2010 ).
Визначення без абсолютних значень здається більш поширеним у літературі; але вона допускає можливість . Використовуючи R та пакет "coda":
require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000) # white noise
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000) # AR(1)
effectiveSize(ts.uncorr) # Sanity check
# result should be close to 10000
effectiveSize(ts.corr)
# result is in the neighborhood of 30000... ???
Функція "ефективні " в "коді" використовує визначення часу автокореляції, еквівалентного , вище. Є кілька інших пакетів R, які обчислюють ефективний розмір вибірки або час автокореляції, і всі ті, що я намагався, дають результати, що відповідають цьому: що процес AR (1) з негативним коефіцієнтом AR має більш ефективні вибірки, ніж корельований часовий ряд. Це здається дивним.
Очевидно, це ніколи не може трапитися у визначенні часу автокореляції.
Яке правильне визначення часу автокореляції? Щось не так у моєму розумінні ефективних розмірів вибірки? результат , показаний вище , здається , що це має бути неправильно ... що відбувається?