Кореляція вимірює лінійну залежність. У неформальному контексті відносини означають щось стійке. Коли ми обчислюємо вибіркове співвідношення для стаціонарних змінних і збільшуємо кількість доступних точок даних, це співвідношення вибірки має тенденцію до істинної кореляції.
Можна показати, що для цін, що зазвичай є випадковими прогулянками, співвідношення вибірки має тенденцію до випадкової величини. Це означає, що незалежно від того, скільки даних ми не маємо, результат завжди буде іншим.
Примітка. Я намагався висловити математичну інтуїцію без математики. З математичної точки зору пояснення дуже зрозуміле: вибіркові моменти стаціонарних процесів вірогідно сходяться до констант. Зразки моментів випадкових прогулянок сходяться до інтегралів броунівського руху, які є випадковими змінними. Оскільки відношення зазвичай виражається як число, а не випадкова величина, стає причиною не обчислення кореляції для нестаціонарних змінних.
Оновлення Оскільки нам цікаво співвідношення двох змінних, спочатку припускаємо, що вони походять від стаціонарного процесу . Стаціонарність передбачає, що E Z t і c o v ( Z t , Z t - h ) не залежать відZt=(Xt,Yt)EZtcov(Zt,Zt−h) . Отже кореляціяt
corr(Xt,Yt)=cov(Xt,Yt)DXtDYt−−−−−−−√
також не залежить від , оскільки всі величини у формулі походять з матриці c o v ( Z t ) , яка не залежить від ttcov(Zt)t . Отже, розрахунок кореляції вибірки
має сенс, оскільки ми можемо мати обґрунтовану надію, що кореляція вибірки оцінитьρ=corr(Xt,Yt). Виявляється, що ця надія не голослівно, такдля стаціонарних процесівякі відповідають певним умовамми маємощор→
ρ^=1T∑Tt=1(Xt−X¯)(Yt−Y¯)1T2∑Tt=1(Xt−X¯)2∑Tt=1(Yt−Y¯)2−−−−−−−−−−−−−−−−−−−−−−−−−−−√
ρ=corr(Xt,Yt) √ρ^→ρ, як ймовірність
. Крім того
T→∞в розподілі, тому ми можемо перевірити гіпотези про
рT−−√(ρ^−ρ)→N(0,σ2ρ)ρ .
Тепер припустимо, що не є нерухомим. Тоді c o r r ( X t , Y t ) може залежати від t . Отже, коли ми спостерігаємо вибірку розміру T, нам потенційно потрібно оцінити T різних співвідношень ρ t . Це, звичайно, нездійсненно, тому в найкращому випадку ми можемо оцінити лише деякий функціонал ρ tZtcorr(Xt,Yt)tTTρtρt такий як середнє значення або дисперсія. Але результат може не мати розумної інтерпретації.
Тепер розглянемо, що відбувається з співвідношенням, ймовірно, найбільш вивченого нестаціонарного випадкового ходу. Ми називаємо процес випадковою ходою, якщо Z t = ∑ t s = 1 ( U t , V t ) , де C t = ( U t , V t ) - стаціонарний процес. Для простоти припустимо, що E C t = 0 . ПотімZt=(Xt,Yt)Zt=∑ts=1(Ut,Vt)Ct=(Ut,Vt)ECt=0
corr(XtYt)=EXtYtDXtDYt−−−−−−−√=E∑ts=1Ut∑ts=1VtD∑ts=1UtD∑ts=1Vt−−−−−−−−−−−−−−−−√
Для подальшого спрощення питань припустимо, що - білий шум. Це означає, що всі кореляції E ( C t C t + h ) дорівнюють нулю при h > 0 . Зауважте, що це не обмежує c o r r ( U t , V t )Ct=(Ut,Vt)E(CtCt+h)h>0corr(Ut,Vt) нулем.
Тоді
corr(Xt,Yt)=tEUtVtt2DUtDVt−−−−−−−−√=corr(U0,V0).
Поки добре, хоча процес не є стаціонарним, кореляція має сенс, хоча нам доводилося робити ті ж обмежувальні припущення.
Тепер, щоб побачити, що відбувається з вибірковою кореляцією, нам потрібно буде використовувати наступний факт про випадкові прогулянки, який називається функціональною центральною граничною теоремою:
в розподілі, деS∈[0,1]іWS=(W1з,W2s)- біваріантнийброунівський рух(двовимірний процес Вінера). Для зручності введіть визначення
1T−−√Z[Ts]=1T−−√∑t=1[Ts]Ct→(cov(C0))−1/2Ws,
s∈[0,1]Ws=(W1s,W2s) .
Ms=(M1s,M2s)=(cov(C0))−1/2Ws
Знову для простоти визначимо вибіркові співвідношення як
ρ^=1T∑Tt=1XtYt1T∑Tt=1X2t1T∑Tt=1Y2t−−−−−−−−−−−−−−−−−−√
Почнемо з варіацій. Ми маємо
E1T∑t=1TX2t=1TE∑t=1T(∑s=1tUt)2=1T∑t=1Ttσ2U=σUT+12.
Це йде до нескінченності, оскільки збільшується, тому ми стикаємося з першою проблемою, дисперсія вибірки не сходить. З іншого боку, теорема безперервного відображення у поєднанні з функціональною центральною граничною теоремою дає намT
де конвергенція - це конвергенція в розподілі, якT→∞.
1T2∑t=1TX2t=∑t=1T1T(1T−−√∑s=1tUt)2→∫10M21sds
T→∞
Аналогічно ми отримуємо
і
1
1T2∑t=1TY2t→∫10M22sds
1T2∑t=1TXtYt→∫10M1sM2sds
Отже, нарешті, для вибіркового співвідношення нашої випадкової прогулянки ми отримаємо
у розподілі якT→∞
ρ^→∫10M1sM2sds∫10M21sds∫10M22sds−−−−−−−−−−−−−−−√
T→∞ .
Отже, хоча кореляція є чітко визначеною, вибіркова кореляція не сходить до неї, як у випадку стаціонарного процесу. Натомість він сходить до певної випадкової величини.