Перетворення матриці подібності в матрицю відстані (евклідова)


27

У алгоритмі випадкових лісів Брейман (автор) будує матрицю подібності таким чином:

  1. Надсилайте всі приклади навчання вниз по кожному дереву в лісі

  2. Якщо два приклади приземляються в один приріст листя, відповідний елемент у матриці подібності на 1

  3. Нормалізуйте матрицю з кількістю дерев

Він каже:

Близькість між випадками n і k утворює матрицю {prox (n, k)}. З їх визначення легко показати, що ця матриця симетрична, позитивна визначена і обмежена вище 1, діагональні елементи дорівнюють 1. Звідси випливає, що значення 1-прокси (n, k) - відстані у квадраті в евклідові простір розміру не більше кількості випадків. Джерело

У своїй реалізації він використовує sqrt (1-prox) , де prox - матриця подібності, щоб перетворити його в матрицю відстані. Я здогадуюсь, що це має щось спільне з цитованими вище цитатами "відстані в евклідовому просторі".

Чи може хтось просвітити трохи світла, чому випливає, що 1-прокси - це відстані у квадраті в евклідовому просторі і чому він використовує квадратний корінь для отримання матриці відстані?

Відповіді:


30

введіть тут опис зображення

г122=год12+год22-2год1год2cosϕгод12год22год1год2cosϕ (= крапковий продукт, = внутрішній продукт) векторів 1 і 2.

Скалярний добуток називають також кутовою подібністю між 1 і 2, а в евклідовому просторі це геометрично найважливіший показник подібності , оскільки він легко перетворюється на евклідову відстань і навпаки (див. Також тут ).

год2cosϕrσ1σ2r12 , а не точками даних, ви можете запитати, чи можна малювати змінні такими векторами, як на малюнку вище. Так, можливо, це називається "предметний простір "спосіб представлення. Теорема косину залишається істинною незалежно від того, що в цьому випадку приймаються як" вектори "- точки даних або особливості даних.]

годсг2=2(1-с)г2г2=1-сrr

ссгодг

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.