Яке обґрунтування функції коваріації Матерна?


19

Коваріаційна функція Матерна зазвичай використовується як функція ядра в Гауссовому процесі. Визначається так

Cν(d)=σ221νΓ(ν)(2νdρ)νKν(2νdρ)

де - функція відстані (наприклад, евклідова відстань), - це гамма-функція, - модифікована функція Бесселя другого роду, і - позитивні параметри. - це багато часу, яке на практиці вибрано або .dΓKνρνν3252

Багато часу це ядро ​​працює краще, ніж стандартне ядро ​​Гаусса, оскільки воно є «менш гладким», але крім цього, чи є якась інша причина, чому хтось віддасть перевагу цьому ядру? Деяка геометрична інтуїція щодо того, як вона поводиться, або якесь пояснення, здавалося б, загадкової формули було б високо оцінено.

Відповіді:


18

Окрім приємної відповіді @DahnJahn, я подумав, що спробую сказати трохи більше про те, звідки беруться функції Бесселя та гамма. Один вихідний пункт для досягнення функції коваріації - теорема Бохнера.

Теорема (Бохнер) Безперервна стаціонарна функція є позитивно визначеною тоді і лише тоді, коли - перетворення Фур'є з кінцевою позитивною мірою: \ widetilde {k} (t) = \ int _ {\ mathbb {R}} e ^ {- iωt} dµ (ω)k(x,y)=k~(|xy|)k~

k~(t)=Reiωtdµ(ω)

З цього можна зробити висновок, що коваріаційна матриця Матерна виведена як перетворення Фур'є (Джерело) . Це все добре, але насправді це не говорить про те, як ви дійшли до цієї кінцевої позитивної міри, заданої . Ну, це (силова) спектральна щільність стохастичного процесу . 11(1+ω2)p f(x)1(1+ω2)pf(x)

Який стохастичний процес? Відомо, що випадковий процес на з функцією коваріації Матерна є рішенням стохастичного часткового диференціального рівняння (SPDE) де - гауссовий білий шум з дисперсією одиниці, - оператор Лапласа, і (я думаю, це в Крессі та Вікле ).Rd

(κ2)α/2X(s)=φW(s),
W(s)
Δ=i=1d2xi2
α=ν+d/2

Навіщо вибирати саме цей SPDE / стохастичний процес? Походження полягає в просторовій статистиці, де стверджується, що це найпростіша і природна коваріація, яка добре працює в :R2

Експоненціальна кореляційна функція - це природна кореляція в одному вимірі, оскільки відповідає марковському процесу. У двох вимірах це вже не так, хоча експоненція є загальною кореляційною функцією в геостатистичних роботах. Віттл (1954) визначив кореляцію, що відповідає стохастичному диференціальному рівнянню типу Лапласа:

[(t1)2+(t2)2κ2]X(t1,t2)=ϵ(t1,t2)
де - білий шум. Відповідний дискретний гратчастий процес є авторегресією другого порядку. (Джерело)ϵ

Сімейство процесів, включених в SDE, пов'язане з рівнянням Матерна, включає модель Орнштейна-Уленбека зі швидкістю частинки, що зазнає броунівського руху. Більш загально, ви можете визначити спектр потужності для сімейства процесів для кожного цілого який також має коваріацію сімейства Матерна. Про це йдеться в додатку Расмуссена та Вільямса.AR(1)AR(p)p

Ця функція коваріації не пов'язана з процесом кластера Матерна.

Список літератури

Крессі, Ноель та Крістофер К. Вікле. Статистика просторово-часових даних. John Wiley & Sons, 2015 рік.

Гутторп, Пітер та Тільман Гнейтінг. "Дослідження історії вірогідності та статистики XLIX Про родину кореляції Матерна". Біометріка 93.4 (2006): 989-995.

Расмуссен, CE та Williams, CKI Гауссові процеси машинного навчання. The MIT Press, 2006.


2
В одновимірному випадку коваріація Матерна з формою з додатним цілим числом є коефіцієнтом безперервного авторегресивного процесу порядку . Однак не всі моделі мають коваріацію Матерна. ν=p1/2pCAR(p)pCAR(p)
Ів

Це очевидне непорозуміння з мого боку, я оновлю відповідь. Дякую!
MachineEpsilon

16

Я не знаю, але мені це питання було дуже цікавим, і ось що я отримав, прочитавши його.

Для певних значень функція коваріації Матерна може бути виражена як добуток експоненції та многочлена. Напр. Для : Тож не надто дивно, що як , насправді сходиться до гауссової RBF : для , функція коваріації Матерна дає абсолютне експоненціальне ядро N , = 5 / 2 З 5 / 2 ( д ) = σ 2 ( 1 + νν=5/2

C5/2(d)=σ2(1+5dρ+5d23ρ2)exp(5dρ)
νCν
limνCν(d)=σ2exp(d22ρ2)
ν=1/2
C1/2(d)=σ2exp(dρ)

Крім того, процес Гаусса з функцією коваріації Матерна з параметром є диференційований .νν1

Це досить добре продемонстровано на знімку, зробленому з Расмуссена та Вільямса (2006) CE Rasmussen & CKI Williams, Гауссові процеси машинного навчання, MIT Press, 2006, ISBN 026218253X.  c 2006 Массачусетський технологічний інститут.  www.GaussianProcess.org/gpml

В інтерполяції просторових даних Штейн (який фактично запропонував назву функції коваріації Матерна) стверджує (стор. 30), що нескінченна диференційованість функції коваріації Гаусса дає нереалістичні результати для фізичних процесів, оскільки спостерігаючи лише невелику безперервну частку простір / час, теоретично, повинен давати всю функцію. Таким чином, він запропонував версію Матерна як узагальнення, яке здатне реалістичніше відповідати фізичним процесам.

Підсумок

Коваріаційну функцію Матерна можна розглядати як узагальнення функції радіальної основи Гаусса . Він містить навіть абсолютне експоненціальне ядро, яке дає докорінно різні результати, і краще здатне фіксувати фізичні процеси завдяки своїй кінцевій диференційованості (для скінченних ).ν

Щодо загадковості появи функції Бесселя, я хотів би бачити подальшу інтуїцію за цим, але я б здогадався, що саме її (асимптотична) поведінка в зробила її корисною в цьому контексті і призвела Штейна до визначити функцію коваріації Матерна. Це, звичайно, не виключає можливості гарного аргументу, чому все це правда.ν


1
(+1) Мені було цікаво, чи є пояснення чи деривація цієї функції коваріації в книзі Матерна pub.epsilon.slu.se/10033/1/… ? Я поки не зміг її знайти. Ця функція коваріації, схоже, займає дуже важливе місце в книзі Штейна, тому я хочу знати більше.
MachineEpsilon

@Machineepsilon чи Matérn кожен фактично згадує / визначає функцію? З книги Штейна я відчув, що він придумав його і назвав його лише Матером.
Дан

Я не впевнений, це якось те, що я хотів з’ясувати! Я спробую придивитись, тому що Расмуссен посилається на книгу.
MachineEpsilon
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.