Як відстань Гоувера обчислює різницю між бінарними змінними?


13

У мене 17 числових і 5 двійкових (0-1) змінних, з 73 вибірками в моєму наборі даних. Мені потрібно запустити аналіз кластеру. Я знаю, що відстань Gower - це хороший показник для наборів даних із змішаними змінними. Однак я не міг зрозуміти, як відстань Гоувера обчислює різницю між бінарними змінними . Мені здається, вона не відрізняється від евклідової відстані.


Ваше питання не зовсім зрозуміло. Ви просто запитуєте "як відстань Гоувера обчислює різницю між бінарними змінними"? Що означає "немає різниці, ніж евклідова"?
gung - Відновити Моніку

1
Дякую. Вибачте, я запитую, як Говер обчислює різницю між бінарними змінними. Я маю на увазі, я не міг зрозуміти відмінностей до цього часу. Евклідова і Говер для бінарної змінної.
Емра Білгіч

Ви шукали цей сайт Gower? stats.stackexchange.com/a/15313/3277
ttnphns

Так. Евклідова відстань дорівнює 0, якщо обидва зразки мають однакове значення, 1 якщо ні. Що з Гоувер?
Емра Білгіч

4
@ EmrahBilgiç, метрика Гоувера - це подібність, а не відстань. Він стає "відстань", коли віднімається від 1. Прочитайте за посиланням вище, як він обробляє двійкові дані.
ttnphns

Відповіді:


5

Як щодо двійкових атрибутів, які мають значення "m" і "f", для "male" і "female"?

Ви розумієте, що для двомовної змінної все, що ви можете отримати, - це "те саме" чи "інше"? Різниця між ключовими точками між відстанями не є, якщо значення дорівнює 1 або 0; але як поєднуються кілька змінних.


3

Gower distance використовує Манхеттен для обчислення відстані між безперервними точками даних і Dice для розрахунку відстані між категоричними точками даних

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.