Кластерний аналіз з подальшим дискримінантним аналізом


10

Яке обґрунтування, якщо воно є, використовувати дискримінантний аналіз (DA) за результатами алгоритму кластеризації, як k-засоби, як я час від часу бачу в літературі (фактично щодо клінічного підтипу психічних розладів)?

Як правило, не рекомендується перевіряти групові відмінності на змінних, які використовувались під час побудови кластерів, оскільки вони підтримують максимізацію (мінімізацію відповідної) інерції між класом (відповідно до класу). Отже, я не впевнений, що повністю оцінюю додаткову цінність передбачуваної ДА, якщо тільки ми не прагнемо вставити людей у ​​факторний простір нижчого виміру та отримати уявлення про "узагальненість" такого розділу. Але навіть у цьому випадку кластерний аналіз залишається принципово дослідницьким інструментом, тож використання такого класу, що обчислюється таким чином, для подальшого отримання правила балів, здається дивним на перший погляд.

Будь-які рекомендації, ідеї чи вказівки до відповідних праць?


Ось пояснення та приклад, використовуючи R: cran.r-project.org/web/packages/adegenet/vignettes/…
Бен

Відповіді:


5

Я не знаю жодної статті з цього приводу. Я використовував цей підхід для описових цілей. DFA надає хороший спосіб узагальнити групові відмінності та розмірність щодо оригінальних змінних. Можна легше просто профілювати групи за вихідними змінними, однак це втрачає сутнісно багатоваріантність проблеми кластеризації. DFA дозволяє описувати групи, зберігаючи багатоваріантність символу проблеми. Отже, це може допомогти з інтерпретацією кластерів, де це і є метою. Це особливо ідеально, коли існує тісний взаємозв'язок між вашим методом кластеризації та вашим методом класифікації - наприклад, DFA та методом Уорда.

Ви маєте рацію щодо проблеми тестування. Я опублікував документ, використовуючи аналіз кластера з подальшим контролем DFA, щоб описати рішення кластеризації. Я представив результати DFA без тестової статистики. Рецензент вирішив проблему з цим. Я поступився і помістив там тестову статистику та значення p із запереченням, що ці значення p не слід тлумачити традиційно.


Якими були б процедурні кроки DA після кластеризації? Чи можете ви придумати інші методи, щоб дізнатися, які оригінальні змінні відрізняють певний кластер від інших?
сьогодні.zuokas

Хочете поділитися цитатою з цим документом, Бретт?
Роман Луштрик

Weissman & Magill. 2008. «Розробка типології студентів для вивчення ефективності семінарів першого курсу» Журнал досвіду першого курсу та студентів у перехідний період 20 (2). Зверніться до мене в автономному режимі, якщо ви хочете отримати копію.
Бретт
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.