Відповіді:
Дискримінантний аналіз передбачає багатоваріантний нормальний розподіл, тому що те, що ми зазвичай вважаємо предикторами, насправді є багатоваріантною залежною змінною, а змінна групування вважається предиктором. Це означає, що категоричні змінні, які слід розглядати як предиктори в тому бажаному сенсі, не обробляються належним чином. Це одна з причин того, що багато хто, в тому числі і я, вважають дискримінаційний аналіз застарілим за допомогою логістичної регресії. Логістична регресія не передбачає жодних припущень щодо розподілу ні з лівої, ні з правого боку моделі. Логістична регресія - це модель прямої ймовірності, і вона не вимагає використання правила Байєса для перетворення результатів у ймовірності, як і дискримінантний аналіз.
Коротка відповідь - це скоріше ні, ніж так.
Одна попередня примітка. Важко сказати, чи слід називати "незалежними" чи "залежними" змінні, які виробляють дискримінантні функції самостійно. LDA - це в основному конкретний випадок канонічного кореляційного аналізу, а тому є двосхилим. Він може розглядатися як MANOVA (із змінною класу як незалежним фактором) або, коли клас дихотомічний, як лінійна регресія класу як залежна змінна. Тому не зовсім законно завжди протистояти LDA з однонаправленими регресіями, такими як логістичний.
LDA припускає, що змінні (ті, які ви назвали "незалежними") походять від багатовимірного нормального розподілу, отже - всі вони безперервні. Це припущення є важливим для (1) стадії класифікації LDA та (2) значущості тестування дискримінантів, що виробляються на стадії вилучення. Сама добування дискримінантів не потребує припущення.
Однак LDA досить стійкий до порушення припущення, яке іноді сприймається як гарантія зробити це на двійкових даних. Насправді це деякі люди роблять. Канонічні кореляції (зокрема LDA - конкретний випадок) можна здійснити там, де обидва набори складаються з двійкових або навіть фіктивних бінарних змінних. Знову ж таки, немає проблеми з вилученням прихованих функцій; проблеми з таким додатком потенційно виникають, коли викликаються значення p або класифікаційні об'єкти.
З двійкових / порядкових змінних можна обчислити тетрахоричні / поліхорні кореляції та подати їх до LDA (якщо програма дозволяє вводити кореляційні матриці замість даних); але тоді обчислення дискримінантних балів на рівні випадку буде проблематичним.
Більш гнучким підходом було б перетворення категоричних (порядкових, номінальних) змінних у безперервні шляхом оптимального масштабування / кількісного визначення . Нелінійний канонічний кореляційний аналіз (ОНЕРАЛІ). Це зробить це під завданням максимізувати канонічні кореляції між двома сторонами (змінною класу та категоричними "провісниками"). Потім ви можете спробувати LDA з перетвореними змінними.
(Мультиноміальна або двійкова) логістична регресія може бути іншою альтернативою LDA.