Як було сказано в попередній відповіді, існує ряд методів зменшення розмірності, і важливо враховувати те, що ви намагаєтесь представляти - вас цікавлять евклідові заходи відстані? Або показник подібності між зразками?
Для перших PCA може бути відповідним. Він зазвичай використовується при безперервних заходах, таких як вимірювання зразків (тварин, рослин тощо). Я хотів би також розглянути більш сучасні згадки в попередній відповіді.
Для останнього, де, можливо, ви намагаєтеся порівняти подібність за допомогою неевклідової метрики відстані, існує кілька хороших методів, такі як впорядкування принципових компонентів (PCoA) та неметрічне багатовимірне масштабування (NMDS). Приклад, коли ви можете їх використовувати, - це, коли ви порівнюєте екологічні спільноти між різними районами, і у вас знайдено кількість різних типів організмів. Отже, ваші дані - це "підрахунок" даних. Існує ряд показників подібності, таких як Жакард, Соренсен, Брей-Кертіс, які ефективно дозволяють оцінити, наскільки схожі ділянки за своїм складом організмів. PCoA та NMDS, в основному, дозволяють побудувати зразки (ділянки), щоб представити екологічну відстань (подібність), і у вас є оцінка для сайту на кожній осі.
Є багато хороших книг та інших ресурсів для багатоваріантного аналізу. Шукайте "Упорядкування" в Google. Крім того, є пакет R під назвою "веганський", який справді хороший для того, щоб виконати багато цієї роботи.