Чи передбачає кореляція стаціонарність даних?


27

Міжоринковий аналіз - це метод моделювання ринкової поведінки за допомогою пошуку зв’язків між різними ринками. Часто співвідношення обчислюється між двома ринками, скажімо, S&P 500 та 30-річними казначействами США. Ці обчислення частіше за все базуються на даних про ціни, що для всіх очевидно, що воно не відповідає визначенню стаціонарних часових рядів.

Можливі рішення убік (використовуючи замість цього повернення), чи є обчислення кореляції, дані якої є нестаціонарними, навіть правильний статистичний розрахунок?

Ви б сказали, що такий розрахунок кореляції є дещо недостовірним, або просто простою дурницею?


1
що ви маєте на увазі під "дійсним статистичним розрахунком", ви повинні сказати дійсний статистичний (оціночний) розрахунок чогось. Тут щось дуже важливе. Кореляція - це коректний розрахунок лінійного відношення між двома наборами даних. Я не бачу, для чого вам потрібна стаціонарність, ви мали на увазі автоматичну кореляцію?
Робін Жирард

2
є новий веб-сайт, який може бути більш підходящим для вашого питання: Quant.stackexchange.com . Тепер ви чітко плутаєте обчислення з інтерпретацією.
mpiktas

@mpiktas, кількісне співтовариство вирішується на використанні прибутку порівняно з цінами через стаціонарність прибутку та нестаціонарність цін. Я прошу тут щось більше, ніж інтуїтивне пояснення, чому так має бути.
Молочниця

@robin, є кілька речей, через які можна поставити під сумнів статистичний аналіз. Розмір вибірки спадає на думку, як і більш очевидні речі, такі як маніпульовані дані. Чи нестаціонарність даних ставить під сумнів кореляційний розрахунок?
Milktrader

не розрахунок, можливо інтерпретація, якщо кореляція не висока. Якщо він високий, це означає високу кореляцію (тобто високе лінійне відношення), два нестаціонарні часові ряди скажімо (Xt) і (Yt) можуть бути потенційно сильно корельованими (наприклад, коли Xt=Yt .
Робін Жирард

Відповіді:


37

Кореляція вимірює лінійну залежність. У неформальному контексті відносини означають щось стійке. Коли ми обчислюємо вибіркове співвідношення для стаціонарних змінних і збільшуємо кількість доступних точок даних, це співвідношення вибірки має тенденцію до істинної кореляції.

Можна показати, що для цін, що зазвичай є випадковими прогулянками, співвідношення вибірки має тенденцію до випадкової величини. Це означає, що незалежно від того, скільки даних ми не маємо, результат завжди буде іншим.

Примітка. Я намагався висловити математичну інтуїцію без математики. З математичної точки зору пояснення дуже зрозуміле: вибіркові моменти стаціонарних процесів вірогідно сходяться до констант. Зразки моментів випадкових прогулянок сходяться до інтегралів броунівського руху, які є випадковими змінними. Оскільки відношення зазвичай виражається як число, а не випадкова величина, стає причиною не обчислення кореляції для нестаціонарних змінних.

Оновлення Оскільки нам цікаво співвідношення двох змінних, спочатку припускаємо, що вони походять від стаціонарного процесу . Стаціонарність передбачає, що E Z t і c o v ( Z t , Z t - h ) не залежать відZt=(Xt,Yt)EZtcov(Zt,Zth) . Отже кореляціяt

corr(Xt,Yt)=cov(Xt,Yt)DXtDYt

також не залежить від , оскільки всі величини у формулі походять з матриці c o v ( Z t ) , яка не залежить від ttcov(Zt)t . Отже, розрахунок кореляції вибірки

має сенс, оскільки ми можемо мати обґрунтовану надію, що кореляція вибірки оцінитьρ=corr(Xt,Yt). Виявляється, що ця надія не голослівно, такдля стаціонарних процесівякі відповідають певним умовамми маємощор

ρ^=1Tt=1T(XtX¯)(YtY¯)1T2t=1T(XtX¯)2t=1T(YtY¯)2
ρ=corr(Xt,Yt)ρ^ρ, як ймовірність . Крім тогоTв розподілі, тому ми можемо перевірити гіпотези прорT(ρ^ρ)N(0,σρ2)ρ .

Тепер припустимо, що не є нерухомим. Тоді c o r r ( X t , Y t ) може залежати від t . Отже, коли ми спостерігаємо вибірку розміру T, нам потенційно потрібно оцінити T різних співвідношень ρ t . Це, звичайно, нездійсненно, тому в найкращому випадку ми можемо оцінити лише деякий функціонал ρ tZtcorr(Xt,Yt)tTTρtρt такий як середнє значення або дисперсія. Але результат може не мати розумної інтерпретації.

Тепер розглянемо, що відбувається з співвідношенням, ймовірно, найбільш вивченого нестаціонарного випадкового ходу. Ми називаємо процес випадковою ходою, якщо Z t = t s = 1 ( U t , V t ) , де C t = ( U t , V t ) - стаціонарний процес. Для простоти припустимо, що E C t = 0 . ПотімZt=(Xt,Yt)Zt=s=1t(Ut,Vt)Ct=(Ut,Vt)ECt=0

corr(XtYt)=EXtYtDXtDYt=Es=1tUts=1tVtDs=1tUtDs=1tVt

Для подальшого спрощення питань припустимо, що - білий шум. Це означає, що всі кореляції E ( C t C t + h ) дорівнюють нулю при h > 0 . Зауважте, що це не обмежує c o r r ( U t , V t )Ct=(Ut,Vt)E(CtCt+h)h>0corr(Ut,Vt) нулем.

Тоді

corr(Xt,Yt)=tEUtVtt2DUtDVt=corr(U0,V0).

Поки добре, хоча процес не є стаціонарним, кореляція має сенс, хоча нам доводилося робити ті ж обмежувальні припущення.

Тепер, щоб побачити, що відбувається з вибірковою кореляцією, нам потрібно буде використовувати наступний факт про випадкові прогулянки, який називається функціональною центральною граничною теоремою:

в розподілі, деS[0,1]іWS=(W1з,W2s)- біваріантнийброунівський рух(двовимірний процес Вінера). Для зручності введіть визначення

1TZ[Ts]=1Tt=1[Ts]Ct(cov(C0))1/2Ws,
s[0,1]Ws=(W1s,W2s) .Ms=(M1s,M2s)=(cov(C0))1/2Ws

Знову для простоти визначимо вибіркові співвідношення як

ρ^=1Tt=1TXtYt1Tt=1TXt21Tt=1TYt2

Почнемо з варіацій. Ми маємо

E1Tt=1TXt2=1TEt=1T(s=1tUt)2=1Tt=1TtσU2=σUT+12.

Це йде до нескінченності, оскільки збільшується, тому ми стикаємося з першою проблемою, дисперсія вибірки не сходить. З іншого боку, теорема безперервного відображення у поєднанні з функціональною центральною граничною теоремою дає намT

де конвергенція - це конвергенція в розподілі, якT.

1T2t=1TXt2=t=1T1T(1Ts=1tUt)201M1s2ds
T

Аналогічно ми отримуємо

і 1

1T2t=1TYt201M2s2ds
1T2t=1TXtYt01M1sM2sds

Отже, нарешті, для вибіркового співвідношення нашої випадкової прогулянки ми отримаємо

у розподілі якT

ρ^01M1sM2sds01M1s2ds01M2s2ds
T .

Отже, хоча кореляція є чітко визначеною, вибіркова кореляція не сходить до неї, як у випадку стаціонарного процесу. Натомість він сходить до певної випадкової величини.


1
Пояснення математичної точки зору - це те, що я шукав. Це дає мені щось замислитись і дослідити далі. Спасибі.
Milktrader

1
Ця відповідь, здається, ухиляється від початкового запитання: Ви не просто сказали, що так, обчислення кореляції має сенс для стаціонарних процесів?
whuber

1
@whuber, я відповідав на питання, маючи на увазі коментар, але перечитав це питання ще раз, і наскільки я розумію, ОП запитує про розрахунок кореляції для нестаціонарних даних. Розрахунок кореляції для стаціонарних процесів має сенс, весь макроекономічний аналіз (VAR, VECM) спирається на це.
mpiktas

Спробую уточнити своє запитання у відповідь.
whuber

3
@whuber, я відволікаю від відповіді, що кореляція, заснована на нестаціонарних даних, дає випадкову змінну, яка може бути, а може і не бути корисною. Кореляція на основі стаціонарних даних перетворюється на постійну. Це може пояснити, чому торговців залучають до "постійної кореляції х-ден", оскільки корельована поведінка швидкоплинна та хибна. Чи є кореляційним чи корисним "співвідношення х-денного дня" чи є іншим питанням.
Milktrader

13

... чи є обчислення кореляції, дані якої є нестаціонарними, навіть правильний статистичний розрахунок?

WhPVP(0)=1P(t+1)=P(t)V(t)>hP(t+1)=P(t)V(t)=P(t)W(t)VWVhW

введіть тут опис зображення

h=5WV

VWVW (слово, яке, можливо, сприймає проблему більше, ніж «ненадійний» або «дурниця»).

Код Mathematica для отримання фігури:

With[{h=5},
pv[{p_, v_}, w_] := With[{q=If[v > h, -p, p]}, {q, q w}];
w = Accumulate[RandomInteger[{-1,1}, 25 h^2]];
{p,v} = FoldList[pv, {1,0}, w] // Transpose;
ListPlot[{w,v}, Joined->True]]

добре, що ваша відповідь вказує на це, але я б не сказав, що процес співвідносний, я б сказав, що вони залежні. У цьому справа. Розрахунок кореляції є валідним, і тут воно скаже "немає кореляції", і всі ми знаємо, що це не означає "немає залежності".
Робін Жирард

1
@robin Це хороший момент, але я побудував цей приклад спеціально так , що для потенційно тривалих періодів часу, ці два процеси цілком корелюють. Питання не в залежності від кореляції, а по суті пов'язане з більш тонким явищем: що взаємозв'язок між процесами змінюється у випадкові періоди. Це, коротко кажучи, саме те, що може статися на реальних ринках (або, принаймні, ми повинні турбуватися, що це може статися!).
whuber

@whubert так, і це дуже хороший приклад, що показує, що існують процеси, які мають дуже високу кореляцію протягом потенційно тривалих періодів часу і все ще взагалі не співвідносяться (але сильно залежать), що стосується більшої часової шкали.
Робін Жирард

2
@robin girard, я думаю, ключовим тут є те, що для нестаціонарних процесів теоретична кореляція змінюється з часом, коли для стаціонарних процесів теоретична кореляція залишається такою ж. Отже, з кореляцією вибірки, яка в основному становить одне число, неможливо фіксувати варіації справжніх кореляцій у разі нестаціонарних процесів.
mpiktas
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.