Яке обґрунтування, якщо воно є, використовувати дискримінантний аналіз (DA) за результатами алгоритму кластеризації, як k-засоби, як я час від часу бачу в літературі (фактично щодо клінічного підтипу психічних розладів)?
Як правило, не рекомендується перевіряти групові відмінності на змінних, які використовувались під час побудови кластерів, оскільки вони підтримують максимізацію (мінімізацію відповідної) інерції між класом (відповідно до класу). Отже, я не впевнений, що повністю оцінюю додаткову цінність передбачуваної ДА, якщо тільки ми не прагнемо вставити людей у факторний простір нижчого виміру та отримати уявлення про "узагальненість" такого розділу. Але навіть у цьому випадку кластерний аналіз залишається принципово дослідницьким інструментом, тож використання такого класу, що обчислюється таким чином, для подальшого отримання правила балів, здається дивним на перший погляд.
Будь-які рекомендації, ідеї чи вказівки до відповідних праць?
R
: cran.r-project.org/web/packages/adegenet/vignettes/…