Як працює криптоінтерполяція?


10

Я працюю над проблемою, в якій мені потрібно використовувати Кригінг для прогнозування значення деяких змінних на основі деяких оточуючих змінних. Я хочу сам реалізувати його код. Отже, я переглянув занадто багато документів, щоб зрозуміти, як це працює, але я так сильно розгубився. Як правило, я розумію, що його середньозважене значення, але я не міг повністю зрозуміти процес обчислення ваги, а потім передбачити значення змінної.

Чи може будь-хто, будь ласка, пояснити мені простими словами математичні аспекти цього методу інтерполяції та як він працює?


3
Реалізація коду - чудовий інструмент навчання, але його не можна рекомендувати для роботи над актуальними проблемами. До того моменту, коли ви будете писати, налагоджувати та перевіряти код, ви виявите, що йому потрібно на порядок більше зусиль, щоб забезпечити додаткові інструменти для просторового розвідувального аналізу даних, варіографії, перехресної перевірки варіограми, пошуку в околицях та після- обробка кригованих результатів. Доцільним і ефективним компромісом було б почати з робочого коду, такого як GSLib або GeoRGLM , і змінити його.
whuber

Дякую велика, це чудова ідея, але я також хочу зрозуміти математичний аспект Кригінга, чи є у вас ресурс, який це чітко пояснює простими словами? Дякую.
Данія

Відповіді:


15

Ця відповідь складається із вступного розділу, який я нещодавно написав для статті, що описує (скромне) просторово-часове розширення "Universal Kriging" (Великобританія), яке саме по собі є скромним узагальненням "звичайного кригінгу". Він має три підрозділи: Теорія дає статистичну модель і припущення; Оцінка стисло переглядає оцінку параметрів найменших квадратів; і Прогнозування показує, як крігінг вписується в рамки Узагальнених найменших квадратів (GLS). Я доклав зусиль, щоб прийняти позначення, знайомі статистикам, особливо відвідувачам цього сайту, та використовувати поняття, які тут добре пояснені.

Підводячи підсумок, кригінг - найкраще лінійне неупереджене передбачення (BLUP) випадкового поля. Це означає, що передбачуване значення в будь-якому не вибірковому місці отримується у вигляді лінійної комбінації значень та коваріатів, що спостерігаються у вибіркових місцях. Значення (невідоме, випадкове) має припущену кореляцію зі значеннями вибірки (а значення вибірки співвідносяться між собою). Ця кореляційна інформація легко переводиться на дисперсію прогнозу. Можна вибирати коефіцієнти в лінійній комбінації ("крижачі ваги"), які роблять цю дисперсію якомога меншою, за умови дотримання нульового зміщення в прогнозі. Деталі випливають.


Теорія

Великобританія складається з двох процедур - однієї оцінки, а іншої прогнозування - що проводиться в контексті моделі GLS для досліджуваної області. Модель GLS передбачає, що вибіркові дані є результатом випадкових відхилень навколо тренду і ці відхилення співвідносяться. Тенденція розуміється в загальному значенні значення, яке можна визначити лінійною комбінацією невідомих коефіцієнтів (параметрів) . (Протягом усієї посади простим позначається матричне переміщення, і всі вектори вважаються векторами стовпців.)zi, (i=1,2,...,n)pβ=(β1,β2,,βp)

У будь-якому місці в досліджуваній області є набір числових атрибутів називається "незалежними змінними" або "коваріатами". (Зазвичай є "постійним терміном", і можуть бути просторовими координатами, а додаткові можуть представляти просторову інформацію, а також іншу допоміжну інформацію, яка доступна у всіх місцях досліджуваної області, таких як пористість водоносний горизонт або відстань до насосної свердловини.) У кожному розташуванні даних , крім його коваріатів , пов'язане спостереженняy=(y1,y2,,yp)y1=1y2y3yiiyi=(yi1,yi2,,yip)ziвважається реалізацією випадкової величини . Навпаки, розглядаються як значення, визначені або характеризують точки або малі області, представлені спостереженнями (дані "підтримує"). У не зважають реалізаціями випадкових величин і повинні бути пов'язані з властивостями будь-якого з .ZiyiyiZi

Лінійна комбінація виражає очікуване значення у перерахунку на параметри , що є значенням тренда в . Процес оцінки використовує дані для пошуку значень що представляють невідомі параметри , тоді як процес прогнозування використовує дані в місцях для обчислення значення в не вибірковому місці , який тут індексується як . Цілі оцінки є фіксованими ( тобто

E[Zi]=yiβ=yi1β1+yi2β2++yipβp
Ziβiβ^iβii=1,2,,ni=0, невипадкові) параметри, тоді як ціль прогнозування є випадковою, оскільки значення включає випадкове коливання навколо його тренду . Зазвичай прогнози робляться для декількох локацій, використовуючи однакові дані, змінюючи розташування . Наприклад, часто робляться прогнози, щоб відобразити поверхню уздовж звичайної сітки точок, придатних для контурування. z0y0β0

Оцінка

Класичне крижінг передбачає випадкові коливання очікуваних значень нуля, їхні коваріації відомі. Запишіть коваріацію між та як . За допомогою цієї коваріації оцінка проводиться за допомогою GLS. Її рішення полягає в наступному: де є - вектор спостережень, (далі «дизайн матриця») є від матриці, рядки якої є векториZiZiZjcij

β^=Hz, H=(YC1Y)1YC1
z=(z1,z2,,zn)nY=(yij)npyi,1in , і - -by- коваріаційна матриця, яка вважається оборотною (Draper & Smith (1981), розділ 2.11) . по матриця , який проектує дані на оцінки параметрів , називається «капелюх матрицею» . Формулювання як застосування матриці капелюхів до даних явно показує, як оцінки параметрів лінійно залежать від даних. КоваріаціїC=(cij)nnpnHzβ^β^C=(cij) класично обчислюються за допомогою варіограми, яка дає коваріацію з точки зору розташування даних, хоча неважливо, як фактично обчислюється коваріація.

Прогнозування

Великобританія аналогічно прогнозує за допомогою лінійної комбінації даних В називається «Крігінг вага» для прогнозування . Великобританія здійснює це передбачення виконуючи два критерії. По-перше, передбачення повинно бути неупередженим, що виражається вимогою, щоб лінійна комбінація випадкових величин в середньому дорівнювала : Це очікування переймається суглобомz0

z^0=λ1z1+λ2z2++λnzn=λz.
λiz0z0ZiZ0
0=E[Z^0Z0]=E[λZZ0].
n+1-перемінний розподіл і . Лінійність очікування разом із припущенням тренда (1) означає: Z0Z=(Z1,Z2,,Zn)
0=E[λZZ0]=λE[Z]E[Z0]=λ(Yβ)y0β=(λYy0)β=β(Yλy0)

незалежно від того, якою може бути . Так буде за умови, щоβ

Y^λ=y0.

Серед усіх можливих рішень цієї недостатньо визначеної системи рівнянь Великобританія обирає для мінімізації дисперсії помилки передбачення . У цьому сенсі Великобританія є "найкращою" серед усіх неупереджених лінійних прогнокторів. Оскільки з цього останнього співвідношення випливає, що помилка передбачення в середньому дорівнює нулю, відхилення - це просто очікування помилки передбачення у квадраті: де - вектор коваріацій міжλZ^0Z0

Var(Z^0Z0)=E[(Z^0Z0)2]=E[(λZZ0)2]=c002λc0+λCλ
c0=(c01,c02,,c0n)Z0і , і - дисперсія . Zi, i1c00Z0

Щоб мінімізувати дисперсію, диференціюйте відносно та введіть вектор множників Лагранжа для включення в обмеження . Це дає систему лінійних рівнянь , записаних у вигляді блокової матриці як де являє собою поλpμY^λ=y0n+p

(CYY0)(λμ)=(c0y0)
0ppматриця нулів. Запис для по одиничної матриці, єдине рішення для задається 1nnλ
λ=Hy0+C1(1YH)c0.

(Читачі, знайомі з множинною регресією, можуть вважати доцільним порівнювати це рішення з рішенням на основі коваріації звичайних найменших квадратних нормальних рівнянь , яке виглядає майже точно так само, але без термінів множника Лагранжа.)

Цей взаємозв'язок представляє крижажні ваги як суму терміна, залежного лише від матриці капелюхів та коваріатів у місці передбачення , плюс термін залежно від коваріацій серед даних і передбачення, . Підставивши його до правої частини рівняння дисперсії, виходить дисперсія прогнозування кригінгу, яка може бути використана для побудови меж прогнозування навколо .λ[Hy0]Z0z^0


1
Дякую тобі сильно, це саме те, що я шукаю. Ви вирішили цю проблему для мене, тепер я розумію Кріґінг. Я дуже ціную вашу допомогу, велике спасибі.
Данія

Фантастичне пояснення. Одне запитання: Що являє ? Як це визначено? Це частина подарунків? Що означає прем'єр? Ця змінна вводиться без визначення, тому я трохи заплутаний у тому, що вона визначена. Y^
DW

@DW Прем'єр позначає транспонировать протягом усієї посади Таким чином, приймаючи перенесення визначення у відповіді, ми можемо описати цю матрицю як " - матриця by , стовпці якої - вектори . " Тим самим він інкапсулює набір даних коваріатів. Y=(yji)pnyi,1in
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.