Рекомендовані книги чи статті як вступ до кластерного аналізу?


12

Я працюю над невеликим корпусом тексту (200 М), який я хочу вивчити за допомогою кластерного аналізу. Які книги чи статті на цю тему ви б рекомендували?

Відповіді:


6

Можливо, варто переглянути книги М. В. Беррі:

  1. Огляд текстового видобутку I: кластеризація, класифікація та пошук (2003)
  2. Огляд текстового майнінгу II: кластеризація, класифікація та пошук (2008)

Вони складаються з серії прикладних та оглядових робіт. Останнє, здається, доступне у форматі PDF за такою адресою: http://bit.ly/deNeiy .

Ось декілька посилань, пов’язаних із CA, що застосовуються до пошуку тексту:

Ви також можете подивитися на " Латентний семантичний аналіз" , але побачити мою відповідь там: Робота над проблемою кластеризації .


5

Пошук груп у даних. Вступ до кластерного аналізу професорів Леонарда Кауфмана та Пітера Дж. Руссо.

Я читаю книгу і вважаю її дуже корисною, оскільки:

  • Як зазначають автори в передмові:

Нашою метою було написати прикладну книгу для загального користувача. Ми хотіли зробити доступ до кластерного аналізу людям, які не обов'язково мають сильну математичну чи статистичну освіту.

  • Він надає теоретичний зміст для розуміння функцій, доступних у Rпакеті Кластер .

  • Глави можна читати індивідуально відповідно до кластерного методу, який цікавить.
    виняток - глава 3, яка побудована на главі 2

Розділи книги:

  1. Вступ
  2. Розбиття навколо медоїдів (програма PAM).
  3. Кластеризація великих програм (програма CLARA).
  4. Нечіткий аналіз (програма FUNNY).
  5. Агломераційне гніздування (програма AGNES).
  6. Роздільний аналіз (програма DIANA).
  7. Монотетичний аналіз (програма MONA).

Список літератури:

Kaufman, L., & Rousseeuw, PJ (2005). Пошук груп у даних. Вступ до кластерного аналізу (с. 342). John Wiley & Sons Inc.

Maechler, M. (2013). Розширений аналіз кластерів Rousseeuw et al. CRAN.


1
Ця книга справді дає хороший огляд поля. Він зосереджується на кількох алгоритмах / методах (наприклад, добре відомий силует, який, начебто, був розроблений одним з авторів книги) і широко висвітлює їх. Він також поставляється з деяким кодом, але стиль 1990 року. FYI: повний зміст .
Franck Dernoncourt


2

Кластерний аналіз Брайана С. Еверітта - це приємна обробка книги, що застосовується за допомогою кластерного аналізу.



Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.