Я намагаюся шукати хороший аргумент щодо того, чому можна використовувати відстань Манхеттена над евклідовою дистанцією в машинному навчанні.
Найближча річ, яку я вважаю хорошим аргументом до цих пір, є на цій лекції MIT .
О 36:15 на слайдах ви можете побачити таке твердження:
"Зазвичай використовують евклідову метрику; Манхеттен може бути доречним, якщо різні розміри не порівнянні ".
Незабаром після того, як професор каже, що через те, що кількість ніг рептилії коливається від 0 до 4 (тоді як інші ознаки є двійковими, змінюються лише від 0 до 1), "кількість ніг" у кінцевому підсумку матиме набагато більше вага, якщо використовується евклідова відстань. Звичайно, це правда. Але ця проблема також була б, якщо використовувати відстань на Манхеттені (лише щоб проблема була трохи пом'якшена, оскільки ми не квадратуємо різницю, як це робимо на евклідовій відстані).
Кращим способом вирішити вищезазначену проблему було б нормалізація функції "кількість ніжок", тому її значення завжди буде від 0 до 1.
Тому, оскільки існує кращий спосіб вирішити проблему, здавалося, що в аргументі використання дистанції Манхеттена в цьому випадку бракує більш сильної точки, принаймні, на мою думку.
Хтось насправді знає, чому і коли хтось використав би відстань на Манхеттені над евклідовою? Чи може хтось надати мені приклад, у якому використання дистанції на Манхеттені дасть кращі результати?