Чому вам потрібно надати модель варіограми, коли ви крижите?


9

Я дуже новачок в просторовій статистиці і переглядаю безліч навчальних посібників,

Але я насправді не розумію, чому вам потрібно надати модель варіограми, коли ви крижите.

Я використовую пакет gstat в R, і це приклад, який вони дають:

library(sp)
data(meuse)
coordinates(meuse) = ~x+y
data(meuse.grid)
str(meuse.grid)
gridded(meuse.grid) = ~x+y
m <- vgm(.59, "Sph", 874, .04)
print(m)
# ordinary kriging:
x <- krige(log(zinc)~1, meuse, meuse.grid, model = m)

Хтось може в декількох рядках пояснити, чому спочатку потрібно поставити vgm? А як ви встановлюєте параметри?

Заздалегідь спасибі! Каспер


Для простого схрещування оцінювач БІЛЬКИЙ, лише якщо середнє значення та просторова коваріація відомі достроково. У звичайному крігінгу оцінюється варіограма з даних, а потім робиться інтерполяція. Дивіться віньєтку з gstatпакету R тих же даних мезе.
Енді Ш

Ей Енді, дякую за ваш коментар. У віньєтці я виявив, що ви можете також крігнути без моделі варіограми. Я зробив наступне: krige (залишки ~ 1, temp_plot_spatial, y, nmin = 5, nmax = 10), тому krige, просто подивившись на мінімум 5 сусідів і максимум 10. Це має сенс взагалі? Результат виглядав приємно: dropbox.com/s/7lxvfiyfl7ekhb4/…
Каспер

Я думаю, у мене є проблема з моделюванням варіограми: що робити, якщо ви вважаєте, що кореляція не має нічого спільного з відстані, а з найближчими сусідами?
Каспер

"що робити, якщо ви припускаєте, що кореляція не має нічого спільного з відстані, а з найближчими сусідами?" - то не кригінг, то він більше відповідає лінії класифікації. Код krige(residuals~1 ,temp_plot_spatial, y, nmin=5, nmax=10)оцінює локальні варіограми. Наприклад, у вас немає варіограми на всьому просторі дослідження, але оцініть нову модель для кожного місця, яке ви намагаєтеся передбачити. Тоді локальна модель отримує лише найближчі 10 значень (оскільки ви не вказуєте максимальну відстань, вона завжди повинна містити 10 значень, тому вона nminповинна бути зайвою).
Andy W

1
Тоді оцінка локальних варіограм є логічною справою. Якщо вони змінюються залежно від певних особливостей, включаючи й інші прогнози в моделі, це також варіант. IDW можна вважати найпростішим типом кригінг-моделі - тому IDW повинен бути не кращим, ніж фактично оцінювати варіограму з даних.
Andy W

Відповіді:


9

Вступ та резюме

Затверджує закон географії Тоблера

Все пов'язане з усім іншим, але поруч речі більше пов'язані, ніж далекі речі.

Кригінг приймає модель тих відносин, у яких

  • "Речі" - це числові значення в місцях розташування на земній поверхні (або в космосі), зазвичай представлені як евклідова площина.

  • Ці числові значення вважаються реалізацією випадкових величин.

  • "Споріднене" виражається через засоби та коваріації цих випадкових величин.

(Колекція випадкових змінних, пов'язаних з точками в просторі, називається "стохастичним процесом".) Варіограма надає інформацію, необхідну для обчислення цих коваріацій.

Що таке Кригінг

Крігінг конкретно - це передбачення речей у місцях, де їх не спостерігали. Щоб зробити процес прогнозування математично відстежуваним, Кригінг обмежує можливі формули лінійними функціями спостережуваних значень. Це робить проблему кінцевою у визначенні, якими мають бути коефіцієнти. Їх можна знайти, вимагаючи, щоб процедура прогнозування мала певні властивості. Інтуїтивно чудовою властивістю є те, що різниці між предиктором та справжнім (але невідомим) значенням мають бути, як правило, невеликими: тобто предиктор повинен бути точним . Ще одна властивість, яка дуже рекламується, але є сумнівнішою, - це те, що в середньому прогноктор повинен дорівнювати справжньому значенню: воно повинно бути точним .

(Причина того, що наполягати на ідеальній точності сумнівна - але не обов'язково погана - полягає в тому, що вона зазвичай робить будь-яку статистичну процедуру менш точною: тобто більш змінною. Коли ви стріляєте в ціль, ви вважаєте за краще розподіляти удари рівномірно навколо обід і рідко потрапляє в центр, або ви приймаєте результати, орієнтовані безпосередньо на центр, але не зовсім на центр? Перший є точним, але неточним, а другий неточним, але точним.)

Ці припущення та критерії - це означає, що коваріації є відповідними способами кількісної оцінки спорідненості, що лінійне прогнозування спрацює, і що передбачувач повинен бути максимально точним, залежно від того, щоб бути абсолютно точним - привести до системи рівнянь, яка має унікальне рішення за умови послідовного визначення коваріацій . Отриманий предиктор тим самим називається "BLUP": найкращий лінійний неупереджений прогноз.

Куди надходить варіограма

Пошук цих рівнянь вимагає операціоналізації щойно описаної програми. Це робиться, записуючи коваріації між предиктором і спостереженнями, що вважаються випадковими змінними. Алгебра ковариаций викликають ковариации серед спостережуваних значень , щоб увійти в Крігінге рівнянь, теж.

У цей момент ми доходимо до тупику, тому що ці коваріації майже завжди невідомі. Зрештою, у більшості застосунків ми спостерігали лише одну реалізацію кожної випадкової величини: а саме наш набір даних, який становить лише одне число у кожному окремому місці. Введіть варіограму: ця математична функція повідомляє нам, якою має бути коваріація між будь-якими двома значеннями. Це обмеження у тому, щоб ці коваріації були "послідовними" (в тому сенсі, що він ніколи не дасть набору коваріацій, які математично неможливі: не всі колекції числових мір "спорідненості" формуватимуть фактичні матриці коваріації ). Ось чому варіограма є важливою для Кригінга.

Список літератури

Оскільки відповіли на негайне запитання, я зупинюсь тут. Зацікавлені читачі можуть дізнатися, як варіограми оцінюються та інтерпретуються, консультуючись з хорошими текстами, такими як « Гірнича геостатистика Юрнеля та Хуйдрегтса» (1978) або « Прикладна геостатистика Ісаака та Срівастава» (1989). (Зверніть увагу, що в процес оцінки вводяться два об'єкти, які називаються "варіограми": емпірична варіограма, отримана з даних, і модель варіограма, яка підходить до неї. Усі посилання на "варіограму" у цій відповіді - на модель. Заклик до vgmзапитання повертає комп’ютерне представлення модельної варіограми.) Для більш сучасного підходу, в якому оцінка варіограми та Кригінг належним чином поєднані, див. Diggle &Геостатистика на основі моделі (2007) (що також є розширеним посібником для Rпакетів GeoRта GeoRglm).


Коментарі

Між іншим, незалежно від того, використовуєте ви Кригінг для прогнозування чи якийсь інший алгоритм, кількісна характеристика спорідненості, яку надає варіограма, корисна для оцінки будь-якої процедури прогнозування. Зауважте, що всі просторові інтерполяційні методи є провісниками з цієї точки зору - і багато з них є лінійними предикторами, такими як IDW (Inverse Distance Weighted). Варіограма може бути використана для оцінки середнього значення та дисперсії (стандартного відхилення) будь-якого з методів інтерполяції. Таким чином, вона має застосовність набагато вищою за її використання в Кригінге.


Дякую за цю детальну відповідь. Я задаю те саме питання, що і вище, що робити, якщо я не можу зробити припущення, що просторова кореляція не залежить від місця розташування? Чи правильно, що моделювання варіограми тоді не корисне, так як я повинен був би зробити модель варіограми для всіх локацій? Тоді краще використовувати IDW?
Каспер

Якщо ви не можете припустити стаціонарність процесу другого порядку , то декілька варіантів включають (1) збір множинних реалізацій процесу (коли він змінюється в залежності від часу); (2) оцінка варіограм за місцевими субрегіонами (коли є багато даних); та (3) припущення параметричної моделі щодо зміни варіограми з розташуванням (як у моделях GARCH для 1D процесів). Останні мої коментарі безпосередньо стосуються неприпустимості відмовитися від чогось типу IDW: чи можна оцінити варіограму чи ні , в принципі вона існує, і тому IDW зазвичай є неоптимальною.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.