У мене є набір даних дискретних (порядкових, меристичних та номінальних) змінних, що описують морфологічні символи крила на кількох близьких видах комах. Що я хочу зробити - це провести якийсь аналіз, який би дав мені наочне уявлення про подібність різних видів на основі морфологічних характеристик. Перше, що мені впало в голову, це PCA (це тип візуалізації, який я хочу створити), але після того, як я розглядаю його (зокрема інші питання, такі як: Чи можна застосувати аналіз основних компонентів до наборів даних, що містять суміш безперервного і категоричні змінні?), здається, PCA може бути невідповідним для дискретних даних (PCA використовується в цих видах досліджень в літературі, але завжди з постійними даними). Ігноруючи статистичну основу того, чому ці дані є невідповідними, PCA дає мені відносно досконалі результати щодо мого біологічного питання (гібридні групи інтересів потрапляють прямо в середину їх батьківських груп).
Я також спробував багаторазовий аналіз листування, щоб заспокоїти статистику (принаймні, наскільки я розумію), але я не можу отримати сюжет, аналогічний тому, який я отримав би з PCA, де мої спостереження (біологічні особи) розділені сказати за кольором, щоб показати різні групи (різні види, біологічно кажучи). Схоже, цей аналіз спрямований на опис того, як змінні (тут мої морфологічні характеристики) пов'язані між собою, а не окремими спостереженнями. І коли я будую спостереження, кольорові за групами, я отримую лише одне значення (можливо, середнє), яке описує всю сукупність людей. Я робив аналіз на R, тому, можливо, я також просто недостатньо розумний, щоб отримати уявлення про сюжет для роботи.
Чи я правильно намагаюся проаналізувати подібний аналіз зі своїми даними, чи я не відстоюю? Якщо ви не можете сказати, моя статистична експертиза є обмеженою, тому рівняння, що відбуваються під цими аналізами, всюди переймаються моєю головою. Я намагаюсь провести цей аналіз повністю описово (мені більше не потрібно робити більше хрускоту число вниз за течією), і я прочитав, що якщо це так, PCA буде достатньо, але хочу переконатися, що я не порушуючи занадто багато статистичних припущень.