Однією з найбільш важливих проблем кластерного аналізу є те, що, можливо, нам доведеться робити різні висновки, коли базуватися на різних методах кластеризації (включаючи різні методи зв’язку в ієрархічній кластеризації).
Мені хотілося б дізнатися вашу думку з цього приводу - який метод ви виберете та як. Можна сказати, «найкращий метод кластеризації - це те, що дає правильну відповідь»; але я можу поставити під сумнів, що кластерний аналіз повинен бути непідвладним методом - тож як я можу знати, який метод чи зв'язок є правильною відповіддю?
Загалом: чи достатньо надійним є групування, на яке можна покластися? Або нам потрібен другий метод, щоб отримати спільний результат, який базується на обох?
Моє запитання не лише щодо можливих способів перевірити / оцінити ефективність кластеризації, але й більш широке - на основі чого ми вибираємо / надаємо перевагу одному методу / алгоритму кластеризації над іншим. Крім того, чи є загальні попередження , про які нам варто оглянути, коли вибираємо метод кластеризації наших даних?
Я знаю, що це дуже загальне питання і дуже важко відповісти. Мені хотілося б знати, чи є у вас якийсь коментар, будь-яка порада чи будь-яка пропозиція, щоб дізнатися більше про це.