У алгоритмі випадкових лісів Брейман (автор) будує матрицю подібності таким чином:
Надсилайте всі приклади навчання вниз по кожному дереву в лісі
Якщо два приклади приземляються в один приріст листя, відповідний елемент у матриці подібності на 1
- Нормалізуйте матрицю з кількістю дерев
Він каже:
Близькість між випадками n і k утворює матрицю {prox (n, k)}. З їх визначення легко показати, що ця матриця симетрична, позитивна визначена і обмежена вище 1, діагональні елементи дорівнюють 1. Звідси випливає, що значення 1-прокси (n, k) - відстані у квадраті в евклідові простір розміру не більше кількості випадків. Джерело
У своїй реалізації він використовує sqrt (1-prox) , де prox - матриця подібності, щоб перетворити його в матрицю відстані. Я здогадуюсь, що це має щось спільне з цитованими вище цитатами "відстані в евклідовому просторі".
Чи може хтось просвітити трохи світла, чому випливає, що 1-прокси - це відстані у квадраті в евклідовому просторі і чому він використовує квадратний корінь для отримання матриці відстані?