Чи мають властивість Гаусса (регресія) універсальну апроксимаційну властивість?


10

Чи може будь-яка безперервна функція на [a, b], де a і b є дійсними числами, наближена або довільно близька до функції (в якійсь нормі) Гауссовими процесами (регресія)?


1
Будьте більш конкретними!
Генрі.Л

1
так! Ну, насправді, це залежить від функції коваріації, але для деяких з них вони є . Дастін Тран та ін. також довела універсальну теорему наближення в байєсівській рамці для Варіаційного Гауссового процесу , яка є більш складною моделлю через функції деформації, але вона дуже тісно пов'язана. Я напишу відповідь, якщо питання повторно відкриється. PS зауважимо, що універсальне наближення, як і для Нейронних мереж, має місце лише над компактним набором, а не над усіма . Rp
DeltaIV

3
Твердження про «універсальне наближення» у цьому питанні, схоже, мало або нічого спільного з твердженням у зазначеній статті Вікіпедії. Дійсно, навіть не ясно, як можна наблизити функцію до процесу . Не могли б ви детальніше зупинитися на тому, що ви намагаєтеся запитати?
whuber

5
@whuber Хоча технічні характеристики можуть бути трохи розкутими, я думаю, що питання по суті означає "Для функції введення , чи є реалізація певного GP, який довільно близький до (в якійсь нормі)?" Або, можливо, "Оскільки ми спостерігаємо нескінченно багато вибіркових точок функції і виконуємо стандартний висновок GP з цими даними, чи вивчена функція заднього середнього наближається до справжньої функції (у певному сенсі)?" Ці двоє мають, звичайно, різні властивості, але я вважаю, що вони досить близькі, щоб відповідати (і, отже, подати п’яте повторне голосування). ffff
Дугал

1
Можливо, ви хочете довести конвергенцію замість наближення. В іншому випадку доказ простий: ви можете прийняти функцію як попередню для середнього. Це не набагато більше , але воно працює. x=x
Карел Мацек

Відповіді:


16

Як зазначає @Dougal, є два різні способи інтерпретації вашого питання. Вони тісно пов'язані, навіть якщо це може здатися не таким.

Перше тлумачення: нехай є компактним підмножиною (компактність є основоположним для всіх наступних !!!), нехай буде a функція безперервної коваріації (або ядро), визначена на , і позначає з нормований простір безперервних функцій на , забезпечений максимальною нормою . Для будь-якої функції , може бути наближена до заданої допуску функцією в RKHS (відтворення простору ядра Гільберта), пов'язаної зXRdk(x,x)X×XC(X)X||||fC(X)fϵk? Ви можете задатися питанням, що таке RKHS, і яке все це стосується регресії Гаусса. RKHS - це закриття векторного простору, утвореного всіма можливими кінцевими лінійними комбінаціями всіх можливих функцій , де . Це дуже суворо пов'язано з регресією процесу Гаусса, тому що заданий Гауссовим процесом попередній на просторі , а потім (закриття) простір усіх можливих задніх засобів, який може бути сформований за допомогою Гауссової процесової регресії, є саме RKHS. Власне, всі можливі задні засоби мають формуK(X)fy(x)=k(x,y)yXGP(0,k(x,x))C(X)

f(x)=i=1ncik(x,xi)

тобто вони є кінцевими лінійними комбінаціями функцій . Таким чином, ми ефективно запитуємо, чи, враховуючи попередній процес Гаусса на , для будь-якої функції там завжди є функцією у (закритті) простору всіх функцій, які можуть бути згенеровані GPR, який максимально наближений до .fxi(x)=k(x,xi)GP(0,k(x,x))C(X)fC(X)ff

Відповідь на деякі конкретні ядра (включаючи класичне ядро ​​Squared Exponential, але не включаючи поліноміальне ядро) - так . Можна довести , що для таких ядер є щільним в , тобто, для будь-якого і для будь-якого допуску , є в , таким що . Зверніть увагу на припущення: є компактним, - безперервним, - суцільним ядром, що має так звану властивість універсального наближення. Дивіться тутK(X)C(X)fC(X)ϵfK(X)||ff||<ϵXfk для повного доказування в більш загальному (таким чином складному) контексті.

Цей результат набагато менш потужний, ніж це здається на перший погляд. Навіть якщо знаходиться в (закриття) простору задніх коштів , які можуть бути отримані з допомогою георадара, ми не довели , що це особлива задня означає повертається GPR для навчання встановлюється досить великий, де з Звичайно, навчальний набір складається з галасливих спостережень у точках . Ми навіть не довели, що заднє середнє значення, повернене GPR, взагалі зближується, для ! Це насправді друга інтерпретація, запропонована @Dougal. Відповідь на це питання залежить від відповіді на перше запитання: якщо немає функціїffx1,,xnnfв RKHS, що є "хорошим наближенням" до , звичайно, ми не можемо сподіватися, що заднє середнє значення, повернене GPR, сходиться до нього. Однак це вже інше питання. Якщо ви хочете отримати відповідь і на це питання, будь ласка, задайте нове запитання.f

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.