"Просторова автокореляція" означає різні речі для різних людей. Однак загальною концепцією є те, що явище, яке спостерігається у місцях може певним чином залежати від (a) коваріатів, (b) місця розташування та (в) його значень у розташованих поблизу місцях. (Якщо технічні визначення різняться, лежать у тому, який тип даних розглядається, який "визначений спосіб" постулюється та що означає "поруч": все це повинно бути кількісно, щоб продовжити.)z
Щоб побачити, що може йти далі, розглянемо простий приклад такої просторової моделі для опису топографії регіону. Нехай вимірювана висота в точці буде . Можлива модель полягає в тому, що деяким певним математичним чином залежить від координат , які я напишу у цій двовимірній ситуації. Нехай представляє (гіпотетично незалежні) відхилення між спостереженнями та моделлю (які, як завжди, мають нульове очікування), можемо записатиzy(z)yz(z1,z2)ε
y(z)=β0+β1z1+β2z2+ε(z)
для лінійної моделі тренду . Лінійна тенденція (представлена коефіцієнтами та ) - це один із способів зафіксувати думку про те, що значення поблизу та для close до , має бути близьким один до одного. Ми можемо навіть обчислити це, розглядаючи очікуване значення розміру різниці між і , . Виявляється, математики багатоβ1β2y(z)y(z′)zz′y(z)y(z′)E[|y(z)−y(z′)|]простіше, якщо ми використовуємо трохи інший показник різниці: натомість обчислюємо очікувану різницю у квадраті :
E[(y(z)−y(z′))2]=E[(β0+β1z1+β2z2+ε(z)−(β0+β1z′1+β2z′2+ε(z′)))2]=E[(β1(z1−z′1)+β2(z2−z2)′+ε(z)−ε(z′))2]=E[(β1(z1−z′1)+β2(z2−z2)′)2+2(β1(z1−z′1)+β2(z2−z2)′)(ε(z)−ε(z′))+(ε(z)−ε(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+E[(ε(z)−ε(z′))2]
Ця модель не містить явної просторової автокореляції, оскільки в ній немає терміна, який безпосередньо стосується до значень .y(z)y(z′)
Альтернативна, інша, модель ігнорує лінійну тенденцію і припускає лише наявність автокореляції. Один із способів зробити це через структуру відхилень . Ми можемо це поставитиε(z)
y(z)=β0+ε(z)
і, для врахування нашого очікування кореляції, ми припустимо якусь "структуру коваріації" для . Щоб це було просторово значущим, будемо вважати, що коваріація між та дорівнює оскільки має нульові засоби, має тенденцію до зменшення, оскільки і стають все більш віддаленими. Оскільки деталі не мають значення, давайте просто назвемо цю коваріацію . Це просторова автокореляція.εε(z)ε(z′)E[ε(z)ε(z′)]εzz′C(z,z′) Дійсно, (звичайна Пірсона) кореляція між і єy(z)y(z′)
ρ(y(z),y(z′))=C(z,z′)C(z,z)C(z′,z′)−−−−−−−−−−−−√.
У цьому позначенні попередня очікувана різниця у квадраті для першої моделі становитьy
E[(y(z)−y(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+E[(ε(z)−ε(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+C1(z,z)+C1(z′,z′)
(припускаючи, що ), оскільки у різних місцях вважається незалежним. Я написав замість щоб вказати, що це функція коваріації для першої моделі.z≠z′εC1C
Коли коваріації не різко різняться від одного місця до іншого (дійсно, їх зазвичай вважають постійними), це рівняння показує, що очікувана різниця в квадраті у збільшується в квадратичному напрямку з поділом між і . Фактична сума приросту визначається коефіцієнтами тренда та .εyzz′β0β1
Давайте подивимося , що очікувані квадрати відмінностей в «s для нової моделі, модель 2:y
E[(y(z)−y(z′))2]=E[(β0+ε(z)−(β0+ε(z′)))2]=E[(ε(z)−ε(z′))2]=E[ε(z)2−2ε(z)ε(z′)+ε(z′)2]=C2(z,z)−2C2(z,z′)+C2(z′,z′).
Знову це поводиться правильно: оскільки ми вважали, що має зменшуватися, оскільки і стають більш відокремленими, очікувана різниця в квадраті дійсно йде вгору із збільшенням розділеності локацій.C2(z,z′)zz′y
Порівнюючи два вирази для у двох моделях показує, що у першій моделі грає роль, математично ідентичну у другій моделі. (Там константа постійної добавки, похована в різних значеннях , але це не має значення в цьому аналізі.) Ерго , залежно від моделі, просторової кореляції типово представляється як деяка комбінація тренду і обумовлена структура кореляції випадкових помилок.( β 1 ( z 1 - z ′ 1 ) + β 2 ( z 2 - z 2 ) ′ ) 2 - 2 C 2 ( z , z ′ ) C i ( z , z )E[(y(z)−y(z′))2](β1(z1−z′1)+β2(z2−z2)′)2−2C2(z,z′)Ci(z,z)
Зараз у нас, я сподіваюся, є чітка відповідь на питання: ідею, що стоїть за Законом географії Тоблера, можна представляти різними способами ("все пов'язане з усім іншим, але ближчі речі більше пов'язані") по-різному. У деяких моделях Закон Тоблера адекватно представлений включенням тенденцій (або «дрейфуючих» термінів), які є функціями просторових координат, таких як довгота та широта. В інших Закон Тоблера фіксується за допомогою нетривіальної структури коваріації серед адитивних випадкових доданків (ε). На практиці моделі включають обидва методи. Вибір, який ви обираєте, залежить від того, що ви хочете досягти з моделлю, і від вашого уявлення про те, як виникає просторова автокореляція - чи вона має на увазі основні тенденції чи відображає зміни, які ви хочете вважати випадковими. Жоден з них не завжди правий, і в будь-якій задачі часто можна використовувати обидва типи моделей для аналізу даних, розуміння явища та прогнозування його значень в інших місцях (інтерполяція).