Чи працює теорема Мерсера у зворотному напрямку?


11

Колега має функцію і для наших цілей це чорний ящик. Функція вимірює подібність s ( a , b ) двох об'єктів.ss(a,b)

Ми точно знаємо, що має такі властивості:s

  1. Оцінки подібності - це реальні числа від 0 до 1, включно.
  2. Тільки об'єкти, які є самоідентичними, мають бали 1. Отже, означає a = b , і навпаки.s(a,b)=1a=b
  3. Ми гарантуємо, що .s(a,b)=s(b,a)

Тепер він хоче працювати з алгоритмами, які вимагають відстаней у якості входів, і залежать від входів, що задовольняють аксіоми відстані.

Моя думка полягала в тому, що ми можемо ставитись до балів подібності так, ніби вони є результатом ядра RBF з деякою відстані (це може бути евклідова норма або інша відстань), тобто ми можемо просто переставити алгебру і припустити, що результати подібності стосуються ядро RBF для пари точок у деякій (невідомої) системі координат.

s(xi,xj)=exp(d(mi,mj)2r)rlogs(xi,xj)=d(mi,mj)

Де - деякий невідомий вектор, а x α - цікавий об'єкт, а d - деяка відстань.mαRnxαd

Очевидні властивості формуються з точки зору дотримання аксіом відстані. Результати повинні бути негативними, а відстані лише 0 для однакових об'єктів. Але не очевидно, що ця досить загальна сукупність обставин є достатньою для того, щоб означати, що нерівність трикутника дотримується.

З іншого боку, це звучить якось божевільно.

Отже, мої запитання: "чи існує такий, що f ( s ( a , b ) ) = d ( a , b ) для d деяка метрика відстані з урахуванням цих властивостей на s , і що це f ?"ff(s(a,b))=d(a,b)dsf

Якщо не існує в цих загальних умовах на S , є додатковий набір вимог , для яких F існує?fsf


3
Зауважте, що навіть якщо вам задано набір парних відстаней , які відповідають аксіомам відстані, не гарантується наявність евклідового простору з точками, що реалізують ці відстані. Таке вбудовування не завжди можливо. Див., Наприклад, math.stackexchange.com/questions/1000006 . d(a,b)
амеба

Це дуже цікава нитка! Дякуємо, що поділилися цим. Мені не було наміру обмежувати себе конкретною дистанцією. (Оскільки, рухаючись у зворотному напрямку, можна використовувати ядро ​​RBF з не-евклідовою дистанцією.)
Sycorax каже, що відбудується Моніка

s(a,b)d(a,b)=f(s(a,b))ds

s

f:f(x)=Ix>0

Відповіді:


6

Чи працює теорема Мерсера у зворотному напрямку?

Не у всіх випадках.

Wikipedia: «У математиці, в зокрема , функціонального аналізу, теорема Мерсера є уявлення про симетричною позитивно певної функції на площі у вигляді суми сходящейся послідовності функцій продукту Ця теорема, представлена в (Mercer 1909), є одним з. найпомітніші результати роботи Джеймса Мерсера - це важливий теоретичний інструмент в теорії інтегральних рівнянь; він використовується в теорії просторів Гільберта про стохастичні процеси, наприклад, теорему Кархунена – Ловва, а також використовується для характеристики симетричне позитивне напіввизначене ядро.

Це " багато на один картування " на просторі Гільберта . - грубою спрощеністю було б описати його як хеш або контрольну суму, яку ви можете перевірити на файл, щоб визначити особистість чи ні.

Більше технічне пояснення: теорема про дезінтеграцію

"У математиці теорема про дезінтеграцію є результатом теорії мір та теорії ймовірностей. Вона суворо визначає ідею нетривіального" обмеження "міри до нульового підмножини відповідного простору міри. Вона пов'язана з існування умовних заходів імовірності. У певному сенсі "дезінтеграція" є протилежним процесом побудови продуктової міри ".

Дивіться також: " Теорема Фубіні-Тонеллі ", " Втрата шарніру ", " Функція втрати " та " Наскільки хороше ядро, коли воно використовується як міра подібності? " (Червень 2007 р.) Натан Сребро, реферат:

" Реферат. Нещодавно Балкан і Блюм запропонували теорію навчання, засновану на загальних функціях подібності, замість позитивних напіввизначених ядер. Ми вивчаємо розрив між гарантіями навчання на основі ядерного навчання та тими, які можна отримати за допомогою ядро як функція подібності, яку залишили відкритими Балкан і Блюм. Ми надаємо значно вдосконалену залежність від того, наскільки хороша функція ядра при використанні в якості функції подібності, і поширюємо результат також на більш практично відповідні втрати шарніру тоді нульовий коефіцієнт помилки. Крім того, ми показуємо, що ця межа є тісною, і, отже, встановлюємо, що насправді існує справжній розрив між традиційним поняттям на основі ядра і новим поняттям на основі подібності. "

s

Див .: ядра та подібність (в R)

Це чорна скринька, тому ви точно не знаєте, яке ядро ​​використовується, якщо воно базується на ядрі, і ви не знаєте деталей реалізації ядра, як тільки думаєте, що знаєте, яке воно є. Дивіться: Рівняння rbfKernel в kernlab відрізняється від стандартного? .

З іншого боку, це звучить якось божевільно.

Це швидко та ефективно за обмежених обставин. Як молоток, якщо ти будеш носити молоток із собою, люди називатимуть тебе божевільним?

" Методи ядра зобов'язані своїм ім'ям використання функцій ядра, які дозволяють їм працювати у високомірному, неявному просторі функцій без будь-якого обчислення координат даних у цьому просторі, а просто шляхом обчислення внутрішніх продуктів між зображеннями всіх пар даних у просторі функцій. Ця операція часто обчислювально дешевша, ніж чітке обчислення координат. Цей підхід називається "фокусом ядра". Функції ядра були введені для даних послідовностей, графіків, тексту, зображень, як а також вектори. ".

Урок: Ви (іноді) отримуєте те, за що платите.

ff(s(a,b))=d(a,b)dsf

Багато хто, див. Посилання вище, " Популярні функції ядра ", RBF , і ось ось один (дорогий) приклад: " Міра відстань відношення ймовірності для подібності між перетворенням Фур'є часових рядів " (2005), Яначек, Бенгалл та Пауелл.

Якщо е не існує в цих загальних умовах на S , є додатковий набір вимог , для яких Ffsf

Різні простори та методи можуть краще націлити порівняння (та дезінтеграцію) конкретних проблем. Існує багато методів лише для простору Гільберта .

Так, список великий, див. Посилання вище та (на одному прикладі): Відтворення простору Гільберта ядра .


-1

Але не очевидно, що ця досить загальна сукупність обставин є достатньою для того, щоб означати, що нерівність трикутника дотримується.

d(a,b)=1s(a,b)x,y,zd(x,y)=13d(y,z)=13d(x,z)=1d(x,z)>d(x,y)+d(y,z)


1
Я не бачу, як це щось підтверджує.
амеба

d

2
f(α)=1α

1
sfdfmsdf

1
m1s(a,b)xαmαs
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.