Я шукаю хорошу термінологію, щоб описати те, що намагаюся зробити, щоб полегшити пошук ресурсів.
Скажімо, у мене є два кластери точок A і B, кожне пов'язане з двома значеннями, X і Y, і я хочу виміряти "відстань" між A і B - тобто наскільки ймовірним є те, що вони були вибірені з одного розподілу (Я можу припустити, що розподіли нормальні). Наприклад, якщо X і Y співвідносяться в A, але не в B, розподіли різні.
Інтуїтивно я отримав би коваріаційну матрицю A, а потім подивимось, наскільки ймовірно, що кожна точка в B вміститься туди, і навпаки (можливо, використовуючи щось таке, як махаланобіська відстань).
Але це трохи "спеціально", і, мабуть, є більш жорсткий спосіб опису цього (звичайно, на практиці у мене є більше двох наборів даних з більш ніж двома змінними - я намагаюся визначити, який із моїх наборів даних є пережилими).
Спасибі!