Що зумовлює U-образний малюнок у просторовій корелограмі?


12

Я помітив у власній роботі цю закономірність, коли вивчав просторову корелограму на різних відстанях, з’являється П-подібний візерунок у кореляціях. Більш конкретно, сильні позитивні кореляції на відстані невеликих відстаней зменшуються з відстанню, потім досягають ями в певній точці, а потім піднімаються назад.

Ось приклад з блогу Conservation Ecology, майданчик макроекології (3) - просторова автокореляція .

I Корелограма Морана

Ці сильніші позитивні автокореляції на більших відстанях теоретично порушують перший закон географії Тоблера, тому я б очікував, що це буде викликано якоюсь іншою закономірністю даних. Я б очікував, що вони досягнуть нуля на певній відстані, а потім навести курсор біля 0 на подальших відстанях (що зазвичай відбувається в сюжетах часових рядів з низьким рівнем AR або MA).

Якщо ви здійснюєте пошук зображень google, ви можете знайти кілька інших прикладів такого ж шаблону (див. Тут ще один приклад). Користувач на веб-сайті ГІС розмістив два приклади, коли шаблон з'являється для I Морана, але не відображається для C Geary's ( 1 , 2 ). У поєднанні з моєю власною роботою ці шаблони можна спостерігати за початковими даними, але, якщо підходити модель до просторових термінів і перевіряти залишки, вони, схоже, не зберігаються.

Я не натрапив на приклади аналізу часових рядів, які показують схожий графік ACF, тому я не впевнений, яка закономірність в оригінальних даних це спричинила. Скортчі в цьому коментарі припускає, що синусоїдальний малюнок може бути викликаний опущеною сезонною схемою в тому часовому ряді. Чи може однотипний просторовий тренд викликати цю закономірність у просторовій корелограмі? Або це якийсь інший артефакт способу обчислення кореляцій?


Ось приклад з моєї роботи. Вибірка досить велика, а світло-сірі лінії - це набір з 19 перестановок вихідних даних для генерування опорного розподілу (тому видно, що дисперсія в червоній лінії очікується досить мала). Тож хоч сюжет не настільки драматичний, як показаний перший, яма, а потім підйом на подальші відстані виявляються досить легко у сюжеті. (Також зауважте, що яма в шахті не є негативною, як і інші приклади, якщо це істотно робить приклади різними, я не знаю.)

введіть тут опис зображення

Ось карта щільності ядра даних, щоб побачити просторовий розподіл, який створив вказану корелограму.

Злочин KDE в DC


1
Я не впевнений, чи правильно це, тому я не розміщую це як відповідь, але я гадаю, що на менших відстанях дуже мало спостережень поруч і дуже схожі. На невеликих відстанях більше спостережень стає «поруч», але вони менш схожі, тому ефект змивається. На великих відстанях все поруч, тому великі, але віддалені ефекти змушують створити резервну копію. (Висока п’ятірка для вивчення мого рідного міста, btw.)I
Sycorax каже: Відновити Моніку

Я бачу, звідки це походить від @ user777, хоча я можу очікувати подібного аргументу, який спричинить тенденцію сюжету до 0, оскільки асимптотично просторове сусідство збільшується. Тобто, коли околиці збільшуються, значення сусідства буде ближче до великої середньої. У моїй голові (я думаю) це призвело б до того, щоб кореляція йшла до нуля, але не одна, але я можу легко помилитися. (Той самий аргумент повинен застосовуватися і до часових рядів, і я не пам'ятаю, як бачили сюжети ACF для часових рядів, які виглядають так.)
Енді W

Kde DC дещо нагадує мені шахову дошку. Як виглядатиме просторовий сюжет автокореляції з шахової дошки? Цікаво, чи не було б воно на високій відстані (однаковий квадрат), низько трохи далі (інший квадрат), а потім знову вище. Я недостатньо знаю цю тему, щоб знати, чи це відповідь.
gung - Відновіть Моніку

@gung, це залежить від того, як ви формулюєте відстань у такому випадку. Для контрольної дошки із суперечливістю королеви це було б синонімом негативного авторегресивного терміну, який для часового ряду спричинив би змову ACF бути альтернативною між позитивними та негативними кореляціями (і хвиля буде згасати, ймовірно, дуже швидко в цьому випадку ). Це складніше, хоча і в просторовому аналізі, ніж у часових рядах. Я б не охарактеризував цей шаблон як шахматну дошку.
Andy W

2
У вашому наборі даних насправді немає достатнього просторового покриття, щоб ви мали оцінювати автоковаріації на відстані 5 кілометрів (вся площа не набагато більше 10 кілометрів, і ви, як правило, хочете мати набір даних, який охоплює багато разів більше довжина кореляції.) Мені здається, що у вас в основному три "краплі" з високою злочинністю приблизно в трикутній формі, з краплями приблизно на 5К один від одного і проміжками між ними. Таким чином, не дивно бачити позитивну кореляцію при такій довжині.
Брайан Борчерс

Відповіді:


4

Пояснення

U-подібна корелограма - поширене явище, коли її обчислення проводять у всій області регіону, в якому відбувається явище. Особливо це виявляється із явищами природи, що нагадують шлейф, наприклад, локалізоване забруднення у ґрунтах чи ґрунтових водах, або, як у цьому випадку, коли явище пов’язане із щільністю населення, яка, як правило, зменшується до межі досліджуваної території (район району Колумбія, яка має міське ядро ​​високої щільності і оточена передмістями нижчої щільності).

Нагадаємо, що корелограма підсумовує ступінь подібності всіх даних відповідно до їх кількості просторового поділу. Більш високі значення схожіші, нижчі значення менш схожі. В тільки пари точок , в яких найбільше просторове розділення може бути досягнуто ті прилегла на діаметрально протилежних сторонах карти. Корелограма, таким чином, порівнює значення вздовж кордону між собою. Коли значення даних, як правило, зменшуються до межі, корелограма може порівнювати лише невеликі значення з малими значеннями. Ймовірно, вони виявлять дуже схожими.

Для будь-якого явища, що нагадує шлейф, або іншого просторово-одномодального явища, тому ми можемо передбачити, перш ніж колись збирати дані, що корелограма, ймовірно, зменшиться до досягнення приблизно половини діаметра області, а потім вона почне збільшуватися.

Вторинний ефект: мінливість оцінки

Вторинний ефект полягає в тому, що для оцінювання корелограми на коротких відстанях є більше пар точок даних, ніж на більших відстанях. На середніх та великих відстанях "відсталі популяції" таких точкових пар зменшуються. Це збільшує мінливість емпіричної корелограми. Іноді ця змінність сама по собі створюватиме незвичайні візерунки у корелограмі. Очевидно, великий верхній набір даних був використаний у верхній фігурі ("Я Морана"), що зменшує цей ефект, але, тим не менш, збільшення мінливості виявляється в більших амплітудах локальних коливань у графіку на відстані понад 3500 або приблизно: рівно половину максимальна відстань.

Отже, тривале правило просторової статистики - уникати обчислення корелограми на відстанях більше половини діаметра досліджуваної області та уникати використання таких великих відстаней для прогнозування (як інтерполяція).

Чому просторова періодичність не є повною відповіддю

У літературі з просторової статистики дійсно зазначається, що просторові періодичні закономірності можуть викликати відскок корелограми на більші відстані. Гірничі геологи називають це "діровою дією". Клас варіограм, що містять синусоїдальний термін, існує для його моделювання. Однак усі ці варіограми також накладають сильний занепад з відстанню, і тому не можуть пояснити екстремальне повернення до повної кореляції, показане на першій фігурі. Більше того, у двох чи більше вимірах неможливо, щоб явище було одночасно ізотропним (у якому кореляції спрямованих всі однакові) та періодичними. Тому періодичність даних не враховує лише те, що відображається.

Що можна зробити

Правильний шлях для таких обставин - визнати, що явище не є стаціонарним, і прийняти модель, яка описує його з точки зору деякої основної детермінованої форми - "дрейфу" чи "тенденції" - з додатковими коливаннями навколо цього дрейфу. які можуть мати просторову (і часову) автокореляцію. Інший підхід до таких даних, як кількість злочинів, полягає у вивченні іншої пов'язаної змінної, наприклад злочинності на одиницю населення.


Дякую, чи вважаєте ви, що потрібна спеціальна зважування для крайових ефектів? (Це може бути надмірним для дослідницького аналізу залишків моделі.) У моїй дисертації я фактично використовую нелінійний просторовий дрейф та умови тенденції - злочинність на одиницю населення дратує з кількох причин. Житлове населення насправді не є базовим рівнем інтересів - воно більше схоже на прогулянку навколо населення. Внутрішні райони міста протягом певних годин можуть сильно набухати (20–30 разів) і більше стосуються нежитлових закладів (робота та розваги).
Енді Ш

У вас є багато варіантів, Енді, оскільки немає можливості визначити унікальну модель: вам потрібно вирішити, де ви хочете зупинити моделювання значень з точки зору просторового дрейфу, і почати моделювати їх (а точніше, їх залишки) з стохастична просторова модель. U-подібну корелограму можна розуміти як вагомий показник того, що потрібен певний механізм моделювання дрейфу. Нормалізація відповідною сукупністю (навіть якщо її можна оцінити лише грубо) - це один із доступних для вас метод. Включення заходів чисельності населення (або використання тощо) як коваріатів - це ще одне.
whuber

Я наблизився, використовуючи лише широкий набір заходів щодо землекористування (бари, АЗС, лікарні, школи тощо), а також просторові умови. Ось карта прогнозів, що підтримують ці інші коваріати постійними . Але все ще є невеликий шматочок залишкової автокореляції. Я скептично налаштований на помилку, наскільки допоможе дасиметричне відображення населення в невеликих місцях, але, думаю, я зроблю цей аналіз у підсумку.
Енді Ш

Це принциповий підхід: нехай теорія керує розробкою дрейфової складової моделі, а потім оцінює залишки, щоб вирішити, чи варто було б скласти проблеми моделювання їх просторової автокореляції. У багатьох випадках більшість очевидних просторових зв'язків адекватно пояснюються термінами дрейфу, і рідко потрібна повна геостатистична техніка. Одним із інтригуючих аспектів вашої проблеми є те, що основна метрика (просторова відстань), можливо, повинна бути часом подорожі або відстані в дорозі уздовж вуличної мережі, а не евклідовою.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.