Кореляція між двома часовими рядами


24

Який найпростіший спосіб / метод обчислити кореляцію між двома часовими рядами, які мають однаковий розмір? Я думав про множення і , і додавання множення. Отже, якщо це єдине число було позитивним, чи можна сказати, що ці два ряди співвідносяться? Я можу припустити кілька прикладів, коли лінійно інший часовий ряд, що зростає експоненціально, не матиме жодного стосунку до іншого, але, як було сказано вище, було б відомо, що вони співвідносяться.(х[т]-мкх)(у[т]-мку)

Будь-які думки?


3
Ви коли-небудь чули про функцію перехресної кореляції - en.wikipedia.org/wiki/Cross-correlation#Time_series_analysis ?
Макрос

Ваші два часові ряди точно однакового розміру. Дивіться stats.stackexchange.com/questions/3463/…, як це схоже, не зовсім тотожне вашому питанню, з двома серіями однакового розміру та частоти, хоча вони нестаціонарні.
Еллі Кессельман

Відповіді:


11

Точка Макроса - це правильний спосіб порівняння співвідношень між часовими рядами за допомогою функції перехресної кореляції (припускаючи стаціонарність). Мати однакову довжину не має істотного значення. Перехресна кореляція при відставанні 0 просто обчислює кореляцію, як, наприклад, оцінка оцінки Пірсона, поєднуючи дані в однакових часових точках. Якщо вони мають таку ж довжину, як ви припускаєте, у вас будуть точні пари T, де T - кількість часових точок для кожного ряду. Перехресна кореляція відставання 1 відповідає часу t від серії 1 із часом t + 1 у серії 2. Зауважте, що тут, хоча і серії однакової довжини, у вас є лише пара T-2, оскільки одна точка у першій серії не відповідає в другій та ще один момент у другій серії не матиме відповідності першому. З огляду на ці дві серії, ви можете оцінити перехресну кореляцію за кількома відставаннями. Якщо будь-яка з перехресних кореляцій статистично достовірно відрізняється від 0, це вказує на кореляцію між двома рядами.


Привіт Майкл, чи можна кількісно оцінити "суттєво інше" - чи можу я використати 1 або 2 стандартне відхилення від нуля як таке значне?
BBDynSys

@ user423805 Я змінив його на читання, що статистично суттєво відрізняється від 0. Формально це означає, що ви перевіряєте нульову гіпотезу про те, що кореляція дорівнює нулю проти альтернативи, що це не 0. Потім обчисліть двостороннє значення p для тестової статистики . Взагалі середня статистична значимість р-значення <= 0,05. Іноді для визначення статистичної значущості використовують інші значення (наприклад, 0,01). Більшість програмних пакетів тимчасових рядів, що включають в себе неодноразові часові серії, можуть зробити ці тести для вас. Наш товариш IrishStat може говорити з цим щодо Autobox.
Майкл Р. Черник

чи є випадки, коли перехресна кореляція при нульовому відстані та груші відрізняється?
Бакабург

4

Ви можете поглянути на аналогічне запитання і мою відповідь. Співвіднесення часових серій, що підказує, що ви можете обчислити перехресні кореляції, АЛЕ тестування їх - це кінь іншого кольору (коня іншого відтінку) завдяки авторегресивній чи детермінованій структурі всередині серія.


якщо я правильно розумію, у цій відповіді ви говорите, що взаємозв'язок між тимчасовими серіями марний.
BBDynSys

user423805 МОЖЕ бути марним, якщо дані не будуть попередньо відфільтровані для отримання IID. Це прямо говорить про справжні занепокоєння ОП щодо хибних висновків, таких як "лелеки, що приносять немовлят. J. Neyman 1938 en.wikipedia.org/wiki/… та amstat.org/about / statisticiciansinhistory /… "тощо. (я можу привести кілька прикладів, однак, коли лінійно інший часовий ряд, що зростає експоненціально, не матиме жодного стосунку до іншого, але обчислення, зазначені вище, повідомляють, що вони співвідносяться.)
IrishStat,

Я думаю, сенс у тому, що серія повинна бути нерухомою, щоб перехресні співвідношення мали сенс. Якщо необхідна фільтрація, слід передати mske серії нерухомими (наприклад, диференціювання або сезонне розмежування). Але називати це марним - неправильно.
Майкл Р. Черник

@Michael Я сказав, що МОЖУ бути марним.
IrishStat

@IrishStat Це був хороший коментар і повернув мене до мого навчання в 1970-х. У той час я дізнавався про часові ряди / методи прогнозування моєї цивільної роботи в армії США. Ми використовували експоненціальне згладжування як спосіб прогнозування на основі історичних даних за суб'єктивними оцінками, які використовувались на складах поставок. Хтось зробив мені велику пропозицію переглянути більш загальні моделі ARIMA та текст 1970 року від Box і Jenkins, і так почався мій інтерес до часових рядів, які стали частиною моєї кар’єри.
Майкл Р. Черник

-1

Тут є кілька цікавих речей

/programming/3949226/calculating-pearson-correlation-and-significance-in-python

Це було власне те, що мені було потрібно. Простий у виконанні та поясненні.


2
-1 З того, що я можу зібрати, ці відповіді стосуються лише стандартного співвідношення продукту-моменту Пірсона. Якщо застосовуватись до двох часових рядів, стандартна кореляція Пірсона дає безглузді результати! Якщо ви дотримуєтесь цих пропозицій, все, що ви робите, - це створення статистичних артефактів. Дивіться, наприклад, math.mcgill.ca/dstephens/OldCourses/204-2007/Handouts/…
Momo
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.