Повідомлення після таблиці ANOVA після аналізу K-засобів вказує на те, що рівні значущості не слід розглядати як випробування рівних засобів, оскільки рішення кластера було отримано на основі евклідової відстані для максимального відстані. Який тест слід використати, щоб показати, чи відрізняються засоби кластерних змінних між кластерами? Я бачив це застереження в таблицях ANOVA, наданих k-засобами, але в деяких посиланнях я бачу, що виконуються пост-спеціальні тести ANOVA. Чи слід ігнорувати k-середні виходи ANOVA та запускати односторонні ANOVA за допомогою post-hoc тестів та інтерпретувати їх традиційним способом? Або я можу лише мати на увазі величину значення F і які змінні сприяли різниці? Інша плутанина полягає в тому, що кластерні змінні зазвичай не розподіляються, що порушує припущення про ANOVA, тоді я міг би використовувати непараметричний тест Крускала-Уолліса, але він має припущення про однакові розподіли. Міжкластерні розподіли для конкретних змінних не виглядають однаковими, деякі позитивно перекошені, деякі негативно… У мене 1275 великих вибірки, 5 кластерів, 10 кластерних змінних, виміряних у балах PCA.