Що є відповідною статистикою для вимірювання просторової автокореляції точок з бінарними значеннями?


9

Я намагаюся визначити рівень просторової автокореляції в точковому наборі даних. Атрибут, який мене цікавить, - двійковий (наявність / відсутність виду), для якого I Морана не підходить. З іншого боку, статистика об'єднаних підрахунків, яка зазвичай рекомендується для двійкових або категоричних даних, очевидно, не підходить для точкових даних. Одним словом, таким чином виникає питання: що є відповідною статистикою для вимірювання глобальної та / або локальної просторової автокореляції точок, коли атрибут, що цікавить, є двійковим?

Відповіді:


4

Твоє твердження про те, що статистика приєднання не підходить для двійкових даних, є невірним. Це лише питання про те, як визначена матриця просторових ваг (Wij). Як і в Morna's-I, ви не можете використовувати матрицю відстані для цього типу аналізу, однак відповідну двійкову матрицю непередбачених ситуацій можна обчислити, використовуючи обмеження відстані. Ви можете створити цей тип матриці просторових ваг, а також провести аналіз приєднання підрахунку в бібліотеці R spdep. Дивіться функції "joincount.test" та joincount.mc (для тесту перестановки в Монте-Карло).


Дякую, Джефрі. Спільні підрахунки - це явно спосіб пошуку бінарних даних, але я побачив припущення (не можу пригадати, де зараз), що спільні підрахунки підходили лише для даних області (не точки). Мені не було очевидно, чому ви не можете створити матрицю ваг, використовуючи поріг відстані, і використовувати спільний підрахунок, але я не міг знайти прикладів цього в деяких побіжних пошуках. Чи є довідка, яку ви можете надати для цього типу використання?
користувач13706

Це великий обсяг літератури з точкового аналізу картини. Статистика приєднаних графів не використовується часто, і, як така, не дуже поширена в сучасній літературі. Я б повернувся до ранньої роботи Diggle чи Geits. Яка ваша мета щодо кількісної оцінки просторової залежності у біноміальних даних? Не можна використовувати коефіцієнт приєднання-підрахунку у чомусь на зразок змішаних ефектів або моделі CAR / SAR. Ось кілька цікавих відомостей про масштабування структури заповнення ( en.wikipedia.org/wiki/Scaling_pattern_of_occupancy )
Джеффрі Еванс

1
RandomForest є непараметричною моделлю і, як така, не впливає на автокореляцію. Стурбованість цієї моделі полягає в кореляції всередині ансамблю завантаження. Часто автокореляція може створити "надмірність" у ваших даних, що створює упередженість у Bootstrap. Я б розглядав, виходячи з умовного розподілу ваших товаришів. У мене є код R "Щільність ймовірності сюжету за коефіцієнтом групування" тут: conserveonline.org/workspaces/emt/documents/all.html
Джефрі Еванс

1
О, я б не узагальнював, що РФ є цілком чорною скринькою. Це насправді не так. Цю модель часто називають "сірою коробкою". Оскільки автокореляція в першу чергу впливає на припущення IID у методах частолістів, це досить безпечне твердження, що непараметричні припущення не порушуються.
Джефрі Еванс

1
Ми узагальнюємо "непараметричну" статистику. Це охоплює багато методів. Якщо ви поглянете на докази Брімана 2001 року, ви побачите, що РФ не бере незалежності. Книга Хасті «Елементи статистичного навчання» дає міцне статистичне підґрунтя для теорії вибірки стосовно методів машинного навчання. Як було сказано раніше, стурбованість викликає співвідношення в ансамблі, яке, безумовно, може бути викликане псевдорепликацією / автокореляцією. Однак це не є модельним припущенням в РФ. Однак, якщо достатньо серйозних, чистий ефект упередженості чи надмірності, очевидно, однаковий.
Джеффрі Еванс

0

Двійкові дані - це звичайний випадок використання для просторової автокореляції. Я думаю, що більшість книг просторового аналізу будуть говорити про це. Цей документ може бути корисним.


1
На першій сторінці вашої довідки підкреслюється, що "місцеположення даних - це регіони ", тому схоже, що воно взагалі не стосується точкових даних.
whuber

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.