Аналіз перехресної кореляції між точковими процесами


15

Я хотів би поради щодо методу аналізу, який я використовую, щоб знати, чи це він статистично звучить.

Я виміряв дві точки процеси і Т 2 = т 2 1 , т 2 2 , . . . , t 2 м, і я хочу визначити, чи події в T 1 якимось чином співвідносяться з подіями в T 2 .T1=t11,t21,...,tn1T2=t12,t22,...,tm2T1T2

Один із методів, які я знайшов у літературі, - це побудова гістограми перехресної кореляції: для кожного ми знаходимо затримку до всіх подій T 2, які потрапляють у задане вікно часу (до і після t 1 n ), а потім будуємо гістограму всіх цих затримок.tn1T2tn1

Якщо два процеси не співвідносяться, я б очікував плоскої гістограми, оскільки ймовірність виникнення події в після (або раніше) події в T 1 дорівнює при всіх затримках. З іншого боку, якщо в гістограмі є пік, це говорить про те, що два точкові процеси якимось чином впливають один на одного (або, принаймні, мають певний загальний внесок).T2T1

Тепер це добре і добре, але як я можу визначити, чи мають гістограми пік (я мушу сказати, що для мого конкретного набору даних вони чітко плоскі, але все-таки було б непогано мати статистичний спосіб підтверджуючи це)?

Отже, ось що я зробив: я повторював процес генерації гістограми кілька (1000) разів, зберігаючи таким, яким він є, і використовуючи "перетасовану" версію T 2 . Для переміщення T 2 я обчислюю інтервали між усіма подіями, переміщую їх та підсумовую для відновлення нового точкового процесу. У RI просто зробити це за допомогою:T1T2T2

times2.swp <- cumsum(sample(diff(times2)))

T2T1

T2T1

Тоді я б взяв це значення 95% за всі часові затримки і використовував би це як деякий "межа довіри" (можливо, це не правильний термін), так що все, що перевищує цю межу в початковій гістограмі, можна вважати "справжньою пік ".

Питання 1 : чи цей метод статистично правильний? Як ні, як би ви вирішили цю проблему?

Питання 2 : Ще одне, що я хочу побачити, - чи існує «довший» тип кореляції моїх даних. Наприклад, можуть відбутися подібні зміни в швидкості подій у двох точкових процесах (зауважте, що вони можуть мати зовсім різні темпи), але я не впевнений, як це зробити. Я думав створити «конверт» кожного процесу точок, використовуючи якесь згладжуюче ядро, а потім виконати перехресний кореляційний аналіз двох конвертів. Чи можете ви запропонувати будь-який інший можливий тип аналізу?

Дякую і вибачте за це дуже довге запитання.

Відповіді:


11

Стандартним методом аналізу цієї проблеми в двох або більше вимірах є функція (перехресна) K Ріплі , але немає причин не використовувати її в одному вимірі. (Пошук Google робить гарну роботу з розкопування посилань.) По суті, він розміщує CDF всіх відстаней між точками в двох реалізаціях, а не наближенням гістограми до PDF цих відстаней. (Варіант, функція L, відображає різницю між K та нульовим розподілом для двох рівномірних некоррельованих процесів.) Це чітко обговорює більшість питань, з якими ви стикаєтесь з необхідністю вибору бункерів, згладжування тощо. Діапазони довіри для K зазвичай створюються за допомогою моделювання. Це легко зробити в Р. Багато пакетів просторової статистики для R можна використовувати безпосередньо або легко адаптувати до цього 1D випадку. Роджера Бівандана оглядовій сторінці CRAN перераховані ці пакунки: див. розділ "Аналіз точкових моделей".


Цікаво ... Наразі я трохи зайнятий, але обов’язково буду дивитись на це!
nico
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.