У мене є набір даних про події, які сталися за той самий період часу. Кожна подія має тип (є кілька різних типів, менше десяти) та місцеположення, представлене у вигляді 2D точки.
Я хотів би перевірити, чи є кореляція між типом подій, або між типом та місцеположенням. Наприклад, можливо, події типу A зазвичай не відбуваються там, де відбуваються події типу B. А може, в якійсь місцевості в основному відбуваються події типу С.
Які інструменти я можу використовувати для цього? Будучи початківцем у статистичному аналізі, моя перша ідея полягала в тому, щоб використовувати цей PCA (аналіз основних компонентів) на цьому наборі даних, щоб побачити, чи має кожен тип подій свій компонент, чи, можливо, деякі поділяють одне і те саме (тобто співвідносяться)?
Я мушу зазначити, що мій набір даних складає близько 500000 балів , що робить речі трохи складнішими для вирішення.
EDIT: Як зазначалося у відповідях нижче та коментарях, шлях для цього - це моделювати це як маркований процес, а потім використовувати R для виконання всіх важких підйомів, як детально пояснено у цьому звіті семінару: http: / /www.csiro.edu.au/resources/Spatial-Point-Patterns-in-R.html