Відповіді:
Як завжди, це залежить від ваших цілей та характеру даних. Для повністю відображених даних потужним інструментом є функція L Ріплі, близький родич K-функції Риплі . Багато програмного забезпечення може обчислити це. ArcGIS може це зробити вже зараз; Я не перевіряв. CrimeStat це робить. Так що GeoDa і R . Приклад його використання із пов’язаними картами наведено в
Сінтон, DS і У. Хубер. Картографування польки та її етнічної спадщини у Сполучених Штатах. Журнал географії Вип. 106: 41-47. 2007 рік
Ось скріншот версії "L функція" версії "Ріплі" K:
Синя крива документує дуже невипадкове розподіл точок, оскільки вона не лежить між червоною та зеленою смугами, що оточують нуль, саме там має лежати синій слід для L-функції випадкового розподілу.
Для вибіркових даних багато що залежить від характеру вибірки. Хорошим ресурсом для цього, доступним для тих, хто має обмежений (але не зовсім відсутній) досвід математики та статистики, є підручник Стівена Томпсона про вибірки .
Як правило, більшість статистичних порівнянь можна проілюструвати графічно, а всі графічні порівняння відповідають або пропонують статистичний аналог. Тому будь-які ідеї, отримані у статистичній літературі, ймовірно, запропонують корисні способи відображення або графічним порівнянням двох наборів даних.
Примітка. Наступне було відредаговано після коментаря whuber
Ви можете скористатися підходом до Монте-Карло. Ось простий приклад. Припустимо, ви хочете визначити, чи розподіл подій злочинів A є статистично подібним подіям B, ви могли б порівняти статистику між подіями A і B з емпіричним розподілом такого заходу для випадково призначених «маркерів».
Наприклад, враховуючи розподіл A (білий) та B (синій),
Ви випадковим чином призначаєте мітки A і B на ВСІ точки в об'єднаному наборі даних. Це приклад єдиного моделювання:
Ви повторюєте це багато разів (скажімо, 999 разів), і для кожного моделювання ви обчислюєте статистику (середній показник найближчого сусіда в цьому прикладі), використовуючи випадково помічені точки. Наступні фрагменти коду знаходяться в R (вимагає використання бібліотеки шпателів ).
nn.sim = vector()
P.r = P
for(i in 1:999){
marks(P.r) = sample(P$marks) # Reassign labels at random, point locations don't change
nn.sim[i] = mean(nncross(split(P.r)$A,split(P.r)$B)$dist)
}
Потім можна графічно порівняти результати (червона вертикальна лінія є початковою статистикою),
hist(nn.sim,breaks=30)
abline(v=mean(nncross(split(P)$A,split(P)$B)$dist),col="red")
або чисельно.
# Compute empirical cumulative distribution
nn.sim.ecdf = ecdf(nn.sim)
# See how the original stat compares to the simulated distribution
nn.sim.ecdf(mean(nncross(split(P)$A,split(P)$B)$dist))
Зауважте, що середня статистика найближчого сусіда може бути не найкращим статистичним показником вашої проблеми. Статистика, така як K-функція, може бути більш показовою (див. Відповідь Валера).
Вищезазначене може бути легко реалізовано всередині ArcGIS за допомогою Modelbuilder. У циклі довільно переставляючи значення атрибутів до кожної точки, а потім обчислюйте просторову статистику. Ви повинні мати можливість підрахувати результати в таблиці.
spatstat
пакеті.
Ви можете перевірити CrimeStat.
За даними веб-сайту:
CrimeStat - це програма просторової статистики для аналізу місць злочинів, розроблена компанією Ned Levine & Associates, яка фінансувалася грантами Національного інституту юстиції (гранти 1997-IJ-CX-0040, 1999-IJ-CX-0044, 2002-IJ-CX-0007 та 2005-IJ-CX-K037). Програма базується на Windows і має інтерфейс з більшістю настільних GIS-програм. Метою є надання додаткових статистичних інструментів для надання допомоги правоохоронним органам та дослідникам кримінального правосуддя в їх здійсненні щодо картографування злочинів. Злочинний стан застосовується багатьма відділами поліції по всьому світу, а також кримінальним правосуддям та іншими дослідниками. Остання версія - 3.3 (CrimeStat III).
Простим і швидким підходом може бути створення теплових карт та карта різниці цих двох теплових карт. Пов'язане: Як створити ефективні теплові карти?
Припустимо, ви переглянули літературу про просторову автоматичну кореляцію. ArcGIS має різні інструменти для точок та натискань, щоб зробити це для вас за допомогою скриптів Toolbox: Інструменти просторової статистики -> Аналіз шаблонів .
Ви могли б працювати назад - Знайдіть інструмент і перегляньте алгоритм, реалізований, щоб побачити, чи відповідає він вашому сценарію. Я використовував індекс Морана колись назад, досліджуючи просторові взаємозв'язки в появі ґрунтових мінералів.
Можна визначити двовимірний кореляційний аналіз у багатьох статистичних програмних програм, щоб визначити рівень статистичної кореляції між двома змінними та рівнем значущості. Потім можна створити резервну копію статистичних висновків, зіставивши одну змінну за допомогою схеми хлороплета, а іншу змінну за допомогою градуйованих символів. Після накладення ви зможете визначити, у яких областях відображаються просторі / високі, високі / низькі та низькі / низькі. У цій презентації є кілька хороших прикладів.
Ви також можете спробувати кілька унікальних програм для геовізуалізації. Мені дуже подобається CommonGIS за такий тип візуалізації. Ви можете вибрати околиці (ваш приклад), і вся корисна статистика та сюжети будуть доступні вам відразу. Це робить аналіз різних змінних карт досить легким.
Для цього чудово підійде квадратовий аналіз. Це GIS-підхід, здатний виділити та порівняти просторові зразки різних точкових шарів даних.
Контур квадратового аналізу, який кількісно визначає просторові зв’язки між декількома шарами даних даних, можна знайти на веб- сайті http://www.nccu.edu/academics/sc/artsandsciences/geospatialscience/_documents/se_daag_poster.pdf .