Краща відстань у використанні


12

Контекст

У мене є два набори даних, які я хочу порівняти. Кожен елемент даних в обох наборах є вектором, що містить 22 кути (всі між і ). Кути відносяться до заданої конфігурації пози людини, тому поза визначається 22 кутами суглоба.πππ

Що я в кінцевому підсумку намагаюся зробити, це визначити "близькість" двох наборів даних. Отже, для кожної пози (22D-вектора) в одному наборі я хочу знайти свого найближчого сусіда в іншому наборі та створити графік відстані для кожної найближчої пари.

Запитання

  • Чи можу я просто використовувати евклідову відстань?
    • Щоб мати значення, я припускаю, що метрику відстані потрібно було б визначити як: , де- абсолютне значення, а mod - модуль. Тоді, використовуючи отримані 22 тети, я можу виконати стандартний евклідовий обчислення відстані .| . . . | θ=|θ1θ2|modπ|...|t12+t22++t222
    • Це правильно?
  • Чи була б кориснішою інша метрика відстані, наприклад, квадратик чи Бхаттачарія, чи якась інша метрика? Якщо так, то можете, будь ласка, надати деяку інформацію про те, чому.

3
Як зауваження: я не думаю, що ви маєте на увазі . Швидше щось на зразок . |θ1θ2|modπmin{|θ1θ2|,2π|θ1θ2|}
Ерік П.

4
Замість того, щоб працювати з кутами, я пропоную перетворити спочатку на (x, y) -координати на одиничному колі. Потім можна обчислити нормально (відстані тощо), і усереднення не є проблемою, як з кутами.
каракал

2
@Josh Ерік П. Пропозиція хороша. В якості альтернативи, розглянемо кожен кут точкою на одиничному колі та обчислити відстань між ними евклідової, використовуючи звичайну (піфагорейську) формулу. Різниця між цими відстанями та кутовими відстанями не має значення. (Я вважаю, що це, можливо, запропонував і Каракал.)θ(cos(θ),sin(θ))
блукання

2
@Josh Середнє значення, наприклад, та - . У багатьох випадках це не має сенсу, і натомість має бути . У вашій конкретній ситуації це може не бути проблемою, оскільки, можливо, людські суглоби не мають діапазону руху минулого . Крім того, у вашому випадку, можливо, ви хочете, щоб згадане середнє значення було оскільки спільний рух є однонаправленим. @ пропозиція whuber - це саме те, що я мав на увазі. π/47π/4π0ππ
каракал

3
Можливо, вашу проблему вирішити буде набагато простіше, якщо ви зможете вказати наслідки "неправильного її розбору". Отже, якщо ви скажете, що набори даних однакові чи подібні, але насправді вони ні, що з вами буде? Чи буде це залежати від того, наскільки неправильним було ваше рішення? Що станеться, якщо ви заявите дані / пози різними, але насправді вони однакові чи подібні? Що втрачено? відповідь на ці запитання допоможе визначити, що має значення для порівняння, яке ви хочете зробити. Це гарантує відповідь на правильне запитання.
ймовірністьлогічний

Відповіді:


5

ви можете обчислити матрицю коваріації для кожного набору, а потім обчислити відстань Хаусдорфа між двома множинами, використовуючи відстань Махаланобіс.

Відстань махаланобіса є корисним способом визначення схожості невідомої вибірки з відомою. Він відрізняється від евклідової відстані тим, що враховує кореляції набору даних і є інваріантним за шкалою.


3

Що ви намагаєтесь зробити з інформацією про найближчого сусіда?

Я відповів би на це питання, а потім порівняв різні заходи відстані з огляду на це.

Наприклад, скажіть, що ви намагаєтеся класифікувати пози на основі спільної конфігурації, і хочете, щоб спільні вектори з тієї ж пози були близько один до одного. Безпосередній спосіб оцінювати придатність різних метрик відстані - використовувати кожну з них у класифікаторі KNN та порівнювати невизначені точності кожної з отриманих моделей.


2

Це здається, що воно схоже на певну програму пошуку інформації (ІЧ). Кілька років тому я відвідував розмову про визнання ходи, яке звучить схоже на те, що ти робиш. У пошуку інформації "документи" (у вашому випадку: дані кута людини) порівнюються з деяким запитом (який у вашому випадку може бути "чи є людина з даними кута (.., ..)"). Потім документи перераховуються в порядку, що відповідає найближчому до того, що відповідає найменшому. Це, в свою чергу, означає, що одна центральна складова ІЧ - це розміщення документа в якомусь векторному просторі (у вашому випадку: кутовий простір) та порівняння його з одним конкретним запитом чи прикладом документа або вимірювання їх відстані. (Див. Нижче.) Якщо у вас є чітке визначення відстані між двома окремими векторами, все, що вам потрібно зробити, - це придумати міру відстані двох наборів даних. (Традиційно в ІЧ відстань у векторній космічній моделі обчислюється або мірою косинуса, або евклідовою відстані, але я не пам’ятаю, як вони це зробили в такому випадку.) В ІР існує також механізм, який називається «зворотній зв'язок відповідності», який, концептуально , працює з відстані двох комплектів документів. Цей механізм зазвичай використовує міру відстані, яка підсумовує всі індивідуальні відстані між усіма парами документів (або у вашому випадку: особові вектори). Можливо, це вам корисно.

На наступній сторінці є статті, які здаються актуальними для вашої проблеми: http://www.mpi-inf.mpg.de/~mmueller/index_publications.html Особливо цей http://www.mpi-inf.mpg.de/ ~ mmueller / публікації / 2006_DemuthRoederMuellerEberhardt_MocapRetrievalSystem_ECIR.pdf здається цікавим. Розмова Мюллера, яку я відвідував, згадує заходи подібності від Ковара та Глейхера, які називаються "хмарною точкою" (див. Http://portal.acm.org/citation.cfm?id=1186562.1015760&coll=DL&dl=ACM ) та однією з них називається "кватерніони" . Сподіваюся, це допомагає.


Було б корисно мати посилання, якщо ви зможете його знайти. Дякую.
Джош

2

Ця проблема називається дистанційним метричним навчанням. Кожна метрика відстані може бути представлена ​​як де є позитивним напіввизначеним. Методи, що знаходяться в цій піддіаграмі, вивчають оптимальний для своїх даних. Насправді, якщо оптимальна виявляється матрицею ідентичності, добре використовувати евклідові відстані. Якщо це зворотна коваріація, було б оптимально використовувати відстань махаланобіс тощо, і так далі. Отже, для вивчення оптимальної , для засвоєння правильної метрики відстані необхідно використовувати метод дистанційного метричного навчання .(xy)tA(xy)AAAA


0

Одна з проблем використання кутів як проксі для форми полягає в тому, що невеликі обурення кутів можуть призвести до великих збурень у формі. Крім того, різні конфігурації кутів можуть призвести до однакової (або подібної) форми.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.