Приклади реального життя різниці між незалежністю та кореляцією


9

Добре відомо, що незалежність випадкових величин передбачає нульову кореляцію, але нульова кореляція не потребує незалежності.

Я натрапив на безліч математичних прикладів, що демонструють залежність, незважаючи на нульову кореляцію. Чи є приклади реального життя, які підтверджують цей факт?


2
Будьте уважні, лише нульова кореляція і спільно нормальні змінні означають незалежність.
Франциск

2
@Siddesh "Але оскільки об'єм не є лінійною функцією довжини, вони не співвідносяться". Ну, не ідеально співвідносяться. Але вони будуть позитивно співвіднесені.
Срібна рибка

1
@Siddhesh: це спрацює лише в тому випадку, якщо ...E[length4]E[length]E[length3]=0
Francis

1
Не соромтеся залишити коментар про нормальний розподіл, якщо ви не згодні з моєю редагуванням. Але я подумав, що це буде краще зняти, оскільки (1) це відволікає сторону до вашого основного питання; (2) його (я думаю) вже задали в CV раніше, ніж це буде дублікатом існуючого матеріалу тут, ( 3) Я не хотів, щоб це викликало плутанину у майбутніх читачів. Я намагався відредагувати питання таким чином, щоб збільшити шанси на його повторне відкриття: я думаю, це запитання досить відмінне від "математичної статистики" на ту саму тему.
Срібна рибка

2
Я все ще думаю, що це питання дійсно приємне, і може залучати ще кілька цікавих відповідей, якщо його можна буде повторно відкрити (що може включати в себе певне редагування, щоб чітко відрізнити його від теми, яку зараз вважають дублікатом). Я підняв тему на Meta про те, що знадобиться для відновлення цього питання. Усі коментарі вітаються.
Срібна рибка

Відповіді:


6

Прибутковість запасів - гідний приклад реального життя того, про що ви просите. Існує дуже близька до нульової кореляції між сьогоднішнім та вчорашнім поверненням S&P 500. Однак існує чітка залежність: повернення у квадраті є позитивно автокорельованими; періоди підвищеної мінливості кластеризовані у часі.

R код:

library(ggplot2)
library(grid)
library(quantmod)

symbols   <- new.env()
date_from <- as.Date("1960-01-01")
date_to   <- as.Date("2016-02-01")
getSymbols("^GSPC", env=symbols, src="yahoo", from=date_from, to=date_to)  # S&P500

df <- data.frame(close=as.numeric(symbols$GSPC$GSPC.Close),
                 date=index(symbols$GSPC))
df$log_return     <- c(NA, diff(log(df$close)))
df$log_return_lag <- c(NA, head(df$log_return, nrow(df) - 1))

cor(df$log_return,   df$log_return_lag,   use="pairwise.complete.obs")  # 0.02
cor(df$log_return^2, df$log_return_lag^2, use="pairwise.complete.obs")  # 0.14

acf(df$log_return,     na.action=na.pass)  # Basically zero autocorrelation
acf((df$log_return^2), na.action=na.pass)  # Squared returns positively autocorrelated

p <- (ggplot(df, aes(x=date, y=log_return)) +
      geom_point(alpha=0.5) +
      theme_bw() + theme(panel.border=element_blank()))
p
ggsave("log_returns_s&p.png", p, width=10, height=8)

Зберігання журналів часу на S&P 500:

журнал повернення журналу

Якби повернення були незалежними протягом часу (і стаціонарними), було б малоймовірно побачити ті зразки кластерної мінливості, і ви б не побачили автокореляцію в квадратних поверненнях журналу.


3

Інший приклад - взаємозв'язок між стресом та оцінкою на іспиті. Зв'язок має зворотну форму U, а кореляція дуже низька, хоча причинно-наслідковий зв’язок здається досить чітким.


2
Це акуратний приклад. Чи є у вас дані чи це просто засноване на досвіді самоаналізу / викладання?
Адріан

1
Я бачив це дослідження, але бачив це багато років тому, тому у мене немає цитування та фактичних даних.
Пітер Флом
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.