Я хотів би поради щодо методу аналізу, який я використовую, щоб знати, чи це він статистично звучить.
Я виміряв дві точки процеси і Т 2 = т 2 1 , т 2 2 , . . . , t 2 м, і я хочу визначити, чи події в T 1 якимось чином співвідносяться з подіями в T 2 .
Один із методів, які я знайшов у літературі, - це побудова гістограми перехресної кореляції: для кожного ми знаходимо затримку до всіх подій T 2, які потрапляють у задане вікно часу (до і після t 1 n ), а потім будуємо гістограму всіх цих затримок.
Якщо два процеси не співвідносяться, я б очікував плоскої гістограми, оскільки ймовірність виникнення події в після (або раніше) події в T 1 дорівнює при всіх затримках. З іншого боку, якщо в гістограмі є пік, це говорить про те, що два точкові процеси якимось чином впливають один на одного (або, принаймні, мають певний загальний внесок).
Тепер це добре і добре, але як я можу визначити, чи мають гістограми пік (я мушу сказати, що для мого конкретного набору даних вони чітко плоскі, але все-таки було б непогано мати статистичний спосіб підтверджуючи це)?
Отже, ось що я зробив: я повторював процес генерації гістограми кілька (1000) разів, зберігаючи таким, яким він є, і використовуючи "перетасовану" версію T 2 . Для переміщення T 2 я обчислюю інтервали між усіма подіями, переміщую їх та підсумовую для відновлення нового точкового процесу. У RI просто зробити це за допомогою:
times2.swp <- cumsum(sample(diff(times2)))
Тоді я б взяв це значення 95% за всі часові затримки і використовував би це як деякий "межа довіри" (можливо, це не правильний термін), так що все, що перевищує цю межу в початковій гістограмі, можна вважати "справжньою пік ".
Питання 1 : чи цей метод статистично правильний? Як ні, як би ви вирішили цю проблему?
Питання 2 : Ще одне, що я хочу побачити, - чи існує «довший» тип кореляції моїх даних. Наприклад, можуть відбутися подібні зміни в швидкості подій у двох точкових процесах (зауважте, що вони можуть мати зовсім різні темпи), але я не впевнений, як це зробити. Я думав створити «конверт» кожного процесу точок, використовуючи якесь згладжуюче ядро, а потім виконати перехресний кореляційний аналіз двох конвертів. Чи можете ви запропонувати будь-який інший можливий тип аналізу?
Дякую і вибачте за це дуже довге запитання.