Ця відповідь складається із вступного розділу, який я нещодавно написав для статті, що описує (скромне) просторово-часове розширення "Universal Kriging" (Великобританія), яке саме по собі є скромним узагальненням "звичайного кригінгу". Він має три підрозділи: Теорія дає статистичну модель і припущення; Оцінка стисло переглядає оцінку параметрів найменших квадратів; і Прогнозування показує, як крігінг вписується в рамки Узагальнених найменших квадратів (GLS). Я доклав зусиль, щоб прийняти позначення, знайомі статистикам, особливо відвідувачам цього сайту, та використовувати поняття, які тут добре пояснені.
Підводячи підсумок, кригінг - найкраще лінійне неупереджене передбачення (BLUP) випадкового поля. Це означає, що передбачуване значення в будь-якому не вибірковому місці отримується у вигляді лінійної комбінації значень та коваріатів, що спостерігаються у вибіркових місцях. Значення (невідоме, випадкове) має припущену кореляцію зі значеннями вибірки (а значення вибірки співвідносяться між собою). Ця кореляційна інформація легко переводиться на дисперсію прогнозу. Можна вибирати коефіцієнти в лінійній комбінації ("крижачі ваги"), які роблять цю дисперсію якомога меншою, за умови дотримання нульового зміщення в прогнозі. Деталі випливають.
Теорія
Великобританія складається з двох процедур - однієї оцінки, а іншої прогнозування - що проводиться в контексті моделі GLS для досліджуваної області. Модель GLS передбачає, що вибіркові дані є результатом випадкових відхилень навколо тренду і ці відхилення співвідносяться. Тенденція розуміється в загальному значенні значення, яке можна визначити лінійною комбінацією невідомих коефіцієнтів (параметрів) . (Протягом усієї посади простим позначається матричне переміщення, і всі вектори вважаються векторами стовпців.)zi, (i=1,2,...,n)pβ=(β1,β2,…,βp)′′
У будь-якому місці в досліджуваній області є набір числових атрибутів називається "незалежними змінними" або "коваріатами". (Зазвичай є "постійним терміном", і можуть бути просторовими координатами, а додаткові можуть представляти просторову інформацію, а також іншу допоміжну інформацію, яка доступна у всіх місцях досліджуваної області, таких як пористість водоносний горизонт або відстань до насосної свердловини.) У кожному розташуванні даних , крім його коваріатів , пов'язане спостереженняy=(y1,y2,…,yp)′y1=1y2y3yiiyi=(yi1,yi2,…,yip)′ziвважається реалізацією випадкової величини . Навпаки, розглядаються як значення, визначені або характеризують точки або малі області, представлені спостереженнями (дані "підтримує"). У не зважають реалізаціями випадкових величин і повинні бути пов'язані з властивостями будь-якого з .ZiyiyiZi
Лінійна комбінація
виражає очікуване значення у перерахунку на параметри , що є значенням тренда в . Процес оцінки використовує дані для пошуку значень що представляють невідомі параметри , тоді як процес прогнозування використовує дані в місцях для обчислення значення в не вибірковому місці , який тут індексується як . Цілі оцінки є фіксованими ( тобто
E[Zi]=y′iβ=yi1β1+yi2β2+⋯+yipβp
Ziβiβ^iβii=1,2,…,ni=0, невипадкові) параметри, тоді як ціль прогнозування є випадковою, оскільки значення включає випадкове коливання навколо його тренду . Зазвичай прогнози робляться для декількох локацій, використовуючи однакові дані, змінюючи розташування . Наприклад, часто робляться прогнози, щоб відобразити поверхню уздовж звичайної сітки точок, придатних для контурування.
z0y′0β0
Оцінка
Класичне крижінг передбачає випадкові коливання очікуваних значень нуля, їхні коваріації відомі. Запишіть коваріацію між та як . За допомогою цієї коваріації оцінка проводиться за допомогою GLS. Її рішення полягає в наступному:
де є - вектор спостережень, (далі «дизайн матриця») є від матриці, рядки якої є векториZiZiZjcij
β^=Hz, H=(Y′C−1Y)−1Y′C−1
z=(z1,z2,…,zn)nY=(yij)npy′i,1≤i≤n , і - -by- коваріаційна матриця, яка вважається оборотною (Draper & Smith (1981), розділ 2.11) . по матриця , який проектує дані на оцінки параметрів , називається «капелюх матрицею» . Формулювання як застосування матриці капелюхів до даних явно показує, як оцінки параметрів лінійно залежать від даних. Коваріації
C=(cij)nnpnHzβ^β^C=(cij) класично обчислюються за допомогою варіограми, яка дає коваріацію з точки зору розташування даних, хоча неважливо, як фактично обчислюється коваріація.
Прогнозування
Великобританія аналогічно прогнозує за допомогою лінійної комбінації даних
В називається «Крігінг вага» для прогнозування . Великобританія здійснює це передбачення виконуючи два критерії. По-перше, передбачення повинно бути неупередженим, що виражається вимогою, щоб лінійна комбінація випадкових величин в середньому дорівнювала :
Це очікування переймається суглобомz0
z^0=λ1z1+λ2z2+⋯+λnzn=λ′z.
λiz0z0ZiZ00=E[Z^0−Z0]=E[λ′Z−Z0].
n+1-перемінний розподіл і . Лінійність очікування разом із припущенням тренда (1) означає:
Z0Z=(Z1,Z2,…,Zn)0=E[λ′Z−Z0]=λ′E[Z]−E[Z0]=λ′(Yβ)−y′0β=(λ′Y−y′0)β=β′(Y′λ−y0)
незалежно від того, якою може бути . Так буде за умови, щоβ
Y^′λ=y0.
Серед усіх можливих рішень цієї недостатньо визначеної системи рівнянь Великобританія обирає для мінімізації дисперсії помилки передбачення . У цьому сенсі Великобританія є "найкращою" серед усіх неупереджених лінійних прогнокторів. Оскільки з цього останнього співвідношення випливає, що помилка передбачення в середньому дорівнює нулю, відхилення - це просто очікування помилки передбачення у квадраті:
де - вектор коваріацій міжλZ^0−Z0
Var(Z^0−Z0)=E[(Z^0−Z0)2]=E[(λ′Z−Z0)2]=c00−2λ′c0+λ′Cλ
c0=(c01,c02,…,c0n)′Z0і , і - дисперсія .
Zi, i≥1c00Z0
Щоб мінімізувати дисперсію, диференціюйте відносно та введіть вектор множників Лагранжа для включення в обмеження . Це дає систему лінійних рівнянь , записаних у вигляді блокової матриці як
де являє собою поλpμY^′λ=y0n+p
(CY′Y0)(λμ)=(c0y0)
0ppматриця нулів. Запис для по одиничної матриці, єдине рішення для задається
1nnλλ=H′y0+C−1(1−YH)c0.
(Читачі, знайомі з множинною регресією, можуть вважати доцільним порівнювати це рішення з рішенням на основі коваріації звичайних найменших квадратних нормальних рівнянь , яке виглядає майже точно так само, але без термінів множника Лагранжа.)
Цей взаємозв'язок представляє крижажні ваги як суму терміна, залежного лише від матриці капелюхів та коваріатів у місці передбачення , плюс термін залежно від коваріацій серед даних і передбачення, . Підставивши його до правої частини рівняння дисперсії, виходить дисперсія прогнозування кригінгу, яка може бути використана для побудови меж прогнозування навколо .λ[H′y0]Z0z^0