Мені хотілося б знати, чи є у вас якісь хороші підручники (швидкі та прості) про тематичні моделі та LDA, навчаючи інтуїтивно, як встановлювати деякі параметри, що вони означають і, якщо можливо, за допомогою реальних прикладів.
Мені хотілося б знати, чи є у вас якісь хороші підручники (швидкі та прості) про тематичні моделі та LDA, навчаючи інтуїтивно, як встановлювати деякі параметри, що вони означають і, якщо можливо, за допомогою реальних прикладів.
Відповіді:
Якщо ви працюєте в R, то підручник Карсона Сіверта щодо використання LDA для моделювання тем в оглядах фільмів є відмінною відправною точкою:
http://cpsievert.github.io/LDAvis/reviews/reviews.html
У цьому підручнику використовується LDAvis, інтерактивна візуалізація тематичних та словесних розподілів, яка справді може допомогти інтуїції.
Також, хоч і не короткі, лекції Девіда М. Блея про тематичні моделі є чудовим ресурсом для розуміння значення параметрів: http://videolectures.net/mlss09uk_blei_tm/
Я настійно рекомендую цей підручник: Початок роботи з моделювання теми та MALLET
Ось кілька додаткових посилань, які допоможуть вам почати роботу ...
Хороші вступні матеріали (включаючи посилання на наукові роботи): http://www.cs.princeton.edu/~blei/topicmodeling.html
Програмне забезпечення:
Ще більше тут, у блозі "Об'єднані оцінки": Список читань моделей тем
Якщо ви шукаєте щось просте для початку і просте у виконанні, я б рекомендував це.
Проект CLARIN-D зібрав кілька хороших покажчиків до навчальних посібників для моделювання тем та LDA на веб- сайті колекції викладання та навчальних матеріалів (TeLeMaCo), який розміщується у центрі CLARIN Universität des Saarlandes .
Я пропоную спробувати підручник з машинного навчання Plu's Gensim . Це дасть вам цілісний огляд NLP та LDA, включаючи: як попередньо обробити ваші дані, зробити інженерію функцій та застосувати LDA.