Запитання з тегом «mixed-type-data»

Набір даних, що включає змінні різного характеру вимірювання (наприклад, безперервні, категоріальні, двійкові, відлікові тощо), аналізовані разом в одному наборі змінних. Використовуйте цей тег, коли це представляє проблему для аналізу. НЕ використовуйте для посилання на [змішана модель].

6
Чи можна застосувати аналіз основних компонентів до наборів даних, що містять суміш безперервних і категоричних змінних?
У мене є набір даних, який містить як безперервні, так і категоричні дані. Я аналізую, використовуючи PCA, і мені цікаво, чи добре включати категоричні змінні у складі аналізу. Я розумію, що PCA можна застосовувати лише до постійних змінних. Це правильно? Якщо їх не можна використовувати для категоричних даних, які альтернативи …

6
Кореляції з не упорядкованими категоричними змінними
У мене є кадр даних з багатьма спостереженнями та багатьма змінними. Деякі з них є категоричними (не упорядкованими), а інші - числовими. Я шукаю асоціацій між цими змінними. Мені вдалося обчислити кореляцію для числових змінних (кореляція Спірмена), але: Я не знаю, як виміряти співвідношення між невпорядкованими категоричними змінними. Я не …

2
Ієрархічна кластеризація даних змішаного типу - яку відстань / схожість використовувати?
У моєму наборі даних є як безперервні, так і природно дискретні змінні. Я хочу знати, чи можемо ми робити ієрархічну кластеризацію, використовуючи обидва типи змінних. І якщо так, то яка міра відстані підходить?

2
Як використовувати як бінарні, так і безперервні змінні разом у кластеризації?
Мені потрібно використовувати бінарні змінні (значення 0 і 1) у k-значенні. Але k-означає працює лише з безперервними змінними. Я знаю, що деякі люди до цих пір використовують ці бінарні змінні в k-значенні, ігноруючи той факт, що k-засоби призначені лише для суцільних змінних. Це для мене неприйнятно. Запитання: То який статистично …

4
Чому змішані дані є проблемою для алгоритмів кластеризації на основі евкліда?
Більшість класичних алгоритмів кластеризації та зменшення розмірності (ієрархічна кластеризація, аналіз основних компонентів, k-засоби, самоорганізуючі карти ...) розроблені спеціально для числових даних, а їх вхідні дані розглядаються як точки в евклідовому просторі. Це, звичайно, проблема, оскільки в багатьох реальних питаннях пов'язані змішані дані: наприклад, якщо ми вивчаємо автобуси, висота і довжина …

8
Кластеризація даних змішаного типу за допомогою R
Заблокований . Це питання та його відповіді заблоковано, оскільки це питання поза темою, але має історичне значення. Наразі не приймає нових відповідей чи взаємодій. Цікаво, чи можна виконати в межах R кластеризацію даних, що мають змішані змінні даних. Іншими словами, у мене є набір даних, що містить як числові, так …


2
Як відстань Гоувера обчислює різницю між бінарними змінними?
У мене 17 числових і 5 двійкових (0-1) змінних, з 73 вибірками в моєму наборі даних. Мені потрібно запустити аналіз кластеру. Я знаю, що відстань Gower - це хороший показник для наборів даних із змішаними змінними. Однак я не міг зрозуміти, як відстань Гоувера обчислює різницю між бінарними змінними . …

1
Надійний кластерний метод для змішаних даних в R
Я шукаю кластеризувати невеликий набір даних (64 спостереження 4-х інтервальних змінних та одна категоріальна трифакторна змінна). Зараз я зовсім новачок у кластерному аналізі, але знаю, що з часів, коли ієрархічна кластеризація або k-засоби були єдиними доступними варіантами, був значний прогрес. Зокрема, видається, що доступні нові методи кластеризації на основі моделей, …

1
t-SNE зі змішаними безперервними та бінарними змінними
В даний час я досліджую візуалізацію об'ємних даних за допомогою t-SNE. У мене є деякі дані зі змішаними бінарними та безперервними змінними, і, схоже, ці дані занадто легко кластерують бінарні дані. Звичайно, це очікується для масштабованих (між 0 і 1) даних: евклідова відстань завжди буде найбільшим / найменшим між бінарними …

1
Дискретні дані та альтернативи PCA
У мене є набір даних дискретних (порядкових, меристичних та номінальних) змінних, що описують морфологічні символи крила на кількох близьких видах комах. Що я хочу зробити - це провести якийсь аналіз, який би дав мені наочне уявлення про подібність різних видів на основі морфологічних характеристик. Перше, що мені впало в голову, …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.