Існує дуже широке розмаїття методів кластеризації, які є дослідницькою природою, і я не думаю, що жоден із них, будь то ієрархічний чи на основі розділів, покладається на ті припущення, з якими доводиться виконувати аналіз аналізу дисперсії.
Переглянувши документацію [MV] у штаті, щоб відповісти на ваше запитання, я знайшов цю кумедну цитату на сторінці 85:
Хоча деякі заявляють, що існує стільки методів кластерного аналізу, скільки людей, які виконують кластерний аналіз. Це грубе заниження! Існує нескінченно більше способів проведення кластерного аналізу, ніж людей, які їх виконують.
У цьому контексті я сумніваюся, що існують якісь припущення, що застосовуються через метод кластеризації. У решті тексту просто викладено загальне правило про те, що для створення кластерів вам потрібна певна форма "міри несхожості", яка навіть не повинна бути метричною дистанцією.
Однак є один виняток, який полягає в тому, що ви кластеруєте спостереження як частина аналізу після оцінки. У Stata vce
команда надходить із таким попередженням на сторінці 86 того самого джерела:
Якщо вам відомий великий масив команд оцінки Stata, будьте обережні, щоб розрізняти кластерний аналіз (команда кластера) та варіант vce (кластерний clustvar), дозволений з багатьма командами оцінювання. Кластерний аналіз знаходить групи в даних. Параметр vce (кластер clustvar), дозволений за допомогою різних команд оцінки, вказує на те, що спостереження незалежні для груп, визначених параметром, але не обов'язково є незалежними в цих групах. Змінна групування, створена командою кластера, рідко задовольняє припущення щодо використання параметра vce (cluster clustvar).
Виходячи з цього, я вважаю, що незалежні спостереження не потрібні поза цим конкретним випадком. Інтуїтивно додам, що кластерний аналіз навіть може бути використаний для точної мети дослідження того, наскільки спостереження незалежні чи ні.
Я закінчу, зазначивши , що, на сторінці 356 з статистики з Stata , Лоуренс Гамільтон згадує стандартизований змінний як «істотний» аспект кластерного аналізу, хоча він і не вдаватися в більш детально з цього питання.