Запитання з тегом «clustering»

Кластерний аналіз - це завдання розподілу даних на підмножини об'єктів відповідно до їх взаємної «подібності» без використання попередніх знань, таких як мітки класів. [Кластерні-стандартні помилки та / або зразки кластерів повинні бути позначені як такі; НЕ використовуйте для них тег "кластеризації".]

4
Кластеризація кореляційної матриці
У мене є кореляційна матриця, яка визначає, як кожен елемент співвідноситься з іншим елементом. Отже, для N елементів я вже маю кореляційну матрицю N * N. Використовуючи цю кореляційну матрицю, як я кластеризую N елементів у M-бункерах, щоб я міг сказати, що Nk-елементи в kth bin поводяться однаково. Прошу допомогти …

5
Чи є функція R, яка обчислить матрицю невідмінності косинусів? [зачинено]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закритий минулого року . Я хотів би зробити теплову карту з кластеризацією рядків на основі косинусних відстаней. Я використовую R і heatmap.2()для виготовлення фігури. Я бачу, що …

3
Причина нормалізації евклідових дистанційних заходів в ієрархічній кластеризації
Мабуть, в ієрархічній кластеризації, в якій мірою відстані є евклідова відстань, дані потрібно спочатку нормалізувати або стандартизувати, щоб запобігти руху коваріату з найбільшою дисперсією від керування кластеризацією. Чому це? Хіба цей факт не бажаний?

8
Кластеризація даних змішаного типу за допомогою R
Заблокований . Це питання та його відповіді заблоковано, оскільки це питання поза темою, але має історичне значення. Наразі не приймає нових відповідей чи взаємодій. Цікаво, чи можна виконати в межах R кластеризацію даних, що мають змішані змінні даних. Іншими словами, у мене є набір даних, що містить як числові, так …


4
Чи можна із категоричними даними існувати кластери без змінних?
Намагаючись пояснити кластерні аналізи, люди звичайно неправильно розуміють процес як пов'язаний із тим, чи співвідносяться змінні. Один із способів позбавити людей від цієї плутанини - це такий сюжет: Це чітко відображає різницю між питанням, чи існують кластери, і питанням, чи пов'язані між собою змінні. Однак це лише ілюструє відмінність суцільних …

4
Як зрозуміти недоліки ієрархічної кластеризації?
Чи може хтось пояснити плюси та мінуси ієрархічної кластеризації? Чи мають ієрархічні кластери такі ж недоліки, що і K? Які переваги ієрархічної кластеризації перед K означає? Коли ми повинні використовувати засоби K над ієрархічною кластеризацією та навпаки? Відповіді на цю посаду дуже добре пояснюють недоліки k означає. Як зрозуміти недоліки …


3
Чому статистика розривів для k-засобів пропонує один кластер, навіть якщо їх очевидно два?
Я використовую K-засоби для кластеризації своїх даних і шукав спосіб запропонувати "оптимальний" номер кластера. Статистика прогалин, здається, є загальним способом пошуку хорошої кількості кластерів. Чомусь він повертає 1 як оптимальне число кластера, але коли я дивлюся на дані, то очевидно, що є 2 кластери: Ось як я називаю розрив у …

1
Алгоритми кластеризації, які працюють на розріджених матрицях даних [закрито]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закрито 5 років тому . Я намагаюся скласти список алгоритмів кластеризації, які є: Реалізовано в R Оперуйте над матричними матрицями даних (не (не) матрицями подібності), такими, які …
18 r  clustering  sparse 


4
Чи існує "прокляття розмірності" насправді в реальних даних?
Я розумію, що таке "прокляття розмірності", і я зробив деякі проблеми з оптимізацією високих розмірів і знаю виклик експоненціальних можливостей. Однак я сумніваюся, чи існує "прокляття розмірності" у більшості даних реального світу (ну давайте на хвилину відкладемо зображення чи відео, я думаю про такі дані, як демографічні дані про клієнта …

2
Кластеризація - інтуїція за теоремою неможливості Кляйнберга
Я думав над тим, щоб написати публікацію в блозі про цей цікавий аналіз Клейнберга (2002), який досліджує труднощі кластеризації. Кляйнберг окреслює три, здавалося б, інтуїтивні дезидерати для функції кластеризації, а потім доводить, що такої функції не існує. Існує багато алгоритмів кластеризації, які задовольняють два з трьох критеріїв; однак жодна функція …

9
Розрахунок індексу ранду
Я намагаюся розібратися, як обчислити індекс Rand алгоритму кластера, але я застряг у тому, як обчислити справжній і хибний негатив. На даний момент я використовую приклад із книги «Вступ до пошуку інформації» (Manning, Raghavan & Schütze, 2009). На сторінці 359 вони розповідають про те, як обчислити індекс Rand. У цьому …
17 clustering 

1
Вхідні параметри для використання прихованого розподілу Діріхле
Під час використання моделювання тем (Latent Dirichlet Allocation) кількість тем є вхідним параметром, який потрібно вказати користувачеві. Мені здається, що ми також повинні запропонувати збірку наборів тем кандидатів, проти яких повинен діяти процес Діріхле? Чи правильно я розумію? На практиці, як налаштувати такий тип набору кандидатів?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.