Я Морана , міра просторової автокореляції, не є особливо надійною статистикою (вона може бути чутливою до перекошених розподілів атрибутів просторових даних).
Які ще надійні методи вимірювання просторової автокореляції? Мені особливо цікаві рішення, які легко доступні / реалізуються на мові сценаріїв, наприклад R. Якщо рішення стосуються унікальних обставин / розповсюдження даних, будь ласка, вкажіть їх у своїй відповіді.
EDIT : Я розширюю питання на кількох прикладах (у відповідь на коментарі / відповіді на початкове запитання)
Запропоновано, що методи перестановки (де розподіл вибірки Морана I генерується за допомогою процедури Монте-Карло) пропонують надійне рішення. Я розумію, що такий тест позбавляє від необхідності робити будь-які припущення щодо розподілу Морана I (з огляду на те, що на статистику тесту може впливати просторова структура набору даних), але я не бачу, як техніка перестановки виправляється не як правило розподілені дані атрибутів . Я пропоную два приклади: один демонструє вплив перекошених даних на I-статистику локального Морана, а другий на глобальний I-I-Moran навіть під час тестів на перестановку.
Я буду використовувати Чжан та ін. 's (2008) аналізує як перший приклад. У своїй роботі вони демонструють вплив розподілу атрибутів на локальний Moran I за допомогою перестановочних тестів (9999 моделювання). Я відтворив результати точок авторів для концентрації свинцю (Pb) (при рівні довіри 5%) за допомогою оригінальних даних (ліва панель) та журналу перетворення цих самих даних (права панель) у GeoDa. Також представлені скриньки вихідних концентрацій Pb та трансформованого журналом. Тут кількість значущих гарячих точок майже подвоюється, коли дані трансформуються; Цей приклад показує , що локальна статистика є чутливим до розподілу даних атрибутів - навіть при використанні методів Монте - Карло!
Другий приклад (змодельовані дані) демонструє вплив перекошених даних на глобальний Іран Морана навіть при використанні тестів на перестановку. Наприклад, в R :
library(spdep)
library(maptools)
NC <- readShapePoly(system.file("etc/shapes/sids.shp", package="spdep")[1],ID="FIPSNO", proj4string=CRS("+proj=longlat +ellps=clrk66"))
rn <- sapply(slot(NC, "polygons"), function(x) slot(x, "ID"))
NB <- read.gal(system.file("etc/weights/ncCR85.gal", package="spdep")[1], region.id=rn)
n <- length(NB)
set.seed(4956)
x.norm <- rnorm(n)
rho <- 0.3 # autoregressive parameter
W <- nb2listw(NB) # Generate spatial weights
# Generate autocorrelated datasets (one normally distributed the other skewed)
x.norm.auto <- invIrW(W, rho) %*% x.norm # Generate autocorrelated values
x.skew.auto <- exp(x.norm.auto) # Transform orginal data to create a 'skewed' version
# Run permutation tests
MCI.norm <- moran.mc(x.norm.auto, listw=W, nsim=9999)
MCI.skew <- moran.mc(x.skew.auto, listw=W, nsim=9999)
# Display p-values
MCI.norm$p.value;MCI.skew$p.value
Зверніть увагу на різницю P-значень. Скручені дані вказують на відсутність кластеризації на рівні 5% значущості (p = 0,167), тоді як нормально розподілені дані вказують на наявність (p = 0,013).
Chaosheng Zhang, Lin Luo, Weilin Xu, Valerie Ledwith, Використання місцевих Moran I і GIS для визначення точок забруднення Pb на міських ґрунтах Голвей, Ірландія, Science of the Total Environment, том 398, випуски 1–3, 15 липня 2008 , Сторінки 212-221