Дані реального світу іноді мають природну кількість кластерів (спроба класифікувати їх у кількість кластерів, менших за якийсь магічний k, спричинить різке збільшення вартості кластеризації). Сьогодні я відвідав лекцію доктора Адама Майєрсона, і він назвав цей тип даних "відокремленими даними".
Які існують формалізації кластеризації, крім K-засобів, які можуть бути піддані алгоритмам кластеризації (апроксимації або евристики), які могли б використовувати природну відокремленість даних?