Визначення часу автокореляції (для ефективного розміру вибірки)


23

У літературі я знайшов два визначення щодо часу автокореляції слабо нерухомого часового ряду:

τa=1+2k=1ρkversusτb=1+2k=1|ρk|

де - автокореляція в відстані . ρk=Cov[Xt,Xt+h]Var[Xt]k

Одним із застосувань часу автокореляції є пошук "ефективного розміру вибірки": якщо у вас є спостережень за тимчасовим рядом, і ви знаєте його час автокореляції , ви можете зробити вигляд, що у вас єnτ

neff=nτ

незалежні вибірки замість співвідносних з метою знаходження середнього. Оцінка даних за даними нетривіальна, але є кілька способів зробити це (див. Thompson 2010 ).нτ

Визначення без абсолютних значень здається більш поширеним у літературі; але вона допускає можливість . Використовуючи R та пакет "coda":τаτa<1

require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000)         # white noise 
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000)    # AR(1)
effectiveSize(ts.uncorr)                             # Sanity check
    # result should be close to 10000
effectiveSize(ts.corr)
    # result is in the neighborhood of 30000... ???

Функція "ефективні " в "коді" використовує визначення часу автокореляції, еквівалентного , вище. Є кілька інших пакетів R, які обчислюють ефективний розмір вибірки або час автокореляції, і всі ті, що я намагався, дають результати, що відповідають цьому: що процес AR (1) з негативним коефіцієнтом AR має більш ефективні вибірки, ніж корельований часовий ряд. Це здається дивним. τa

Очевидно, це ніколи не може трапитися у визначенні часу автокореляції.τb

Яке правильне визначення часу автокореляції? Щось не так у моєму розумінні ефективних розмірів вибірки? результат , показаний вище , здається , що це має бути неправильно ... що відбувається?neff>n


Просто для того, щоб переконатися, що я не зрозумів неправильно, чи не це повинно бути замість h ? Cov(Xt,Xt+k)h
sachinruk

2
Мене цікавить друге визначення, тобто . Чи можете ви надати літературу там, де ви її знайшли? τb
Гаррі

Відповіді:


17

По-перше, відповідне визначення поняття "ефективний розмір вибірки" пов'язане з цілком конкретним питанням. Якщо однаково розподілені з середнім ц і дисперсією 1 емпіричне середнє ц = 1X1,X2,μ - неупереджений оцінювачμ. А як щодо його дисперсії? Длянезалежнихзмінних дисперсія дорівнюєn-1. Для слабо стаціонарних часових рядів, дисперсія ц є 1

μ^=1nk=1nXk
μn1μ^ Апроксимація справедлива для досить великихn. Якщо визначитиneff=n/τa, дисперсія середнього емпіричного для слабостаціонарного часового ряду становить приблизноn - 1 eff , що є такою ж дисперсією, як якщо б ми малиneffнезалежних вибірок. Таким чином,neff=n/τa- це відповідне визначення, якщо ми попросимо дисперсію емпіричного середнього. Це може бути недоцільним для інших цілей.
1n2k,l=1ncov(Xk,Xl)=1n(1+2(n1nρ1+n2nρ2++1nρn1))τan.
nneff=n/τaneff1neffneff=n/τa

При негативній кореляції між спостереженнями, безумовно, можливо, що дисперсія може стати меншою ніж ( n eff > n ). Це добре відома методика зменшення дисперсії в інтеграції Monto Carlo: Якщо ми введемо негативну кореляцію між змінними замість кореляції 0, ми можемо зменшити дисперсію, не збільшуючи розмір вибірки.n1neff>n


2
Для всіх, хто хоче дізнатися більше про використання негативної кореляції в моделюванні Монте-Карло, спробуйте гуглінг "антитетичні варіанти". Більше інформації в курсових замітках тут або тут .
andrewtinka

1

див. http://arxiv.org/pdf/1403.5536v1.pdf

і

https://cran.r-project.org/web/packages/mcmcse/mcmcse.pdf

для ефективного розміру вибірки. Я думаю, що альтернативна рецептура з використанням співвідношення дисперсії вибірки та асимптотичної дисперсії ланцюга Маркова через серійне середнє значення є більш підходящим оцінником.


4
Чи можете ви розширити вміст у цих посиланнях? На даний момент, це занадто коротко, щоб відповісти нашим стандартам!
kjetil b halvorsen
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.