Відповіді:
Це, в основному, міра корисності класифікації k-засобів, що знайшла. SS очевидно означає Суму квадратів, тому це звичайне розкладання відхилення на відхилення "Між" та відхилення "В межах". В ідеалі потрібно кластеризація, яка має властивості внутрішньої згуртованості та зовнішнього поділу, тобто співвідношення BSS / TSS має наближатися до 1.
Наприклад, в R:
data(iris)
km <- kmeans(iris[,1:4], 3)
дає співвідношення BSS / TSS 88,4% (0,884), що вказує на гарну форму. Ви повинні бути обережними, і зазвичай корисно побудувати WSS проти кількості кластера, оскільки це число потрібно заздалегідь вказати.