Ці терміни багато кидаються разом, але я хотів би знати, що, на вашу думку, є відмінностями, якщо такі є.
Спасибі
Ці терміни багато кидаються разом, але я хотів би знати, що, на вашу думку, є відмінностями, якщо такі є.
Спасибі
Відповіді:
LSA та LSI в основному використовуються синонімічно, при цьому спільнота пошуку інформації зазвичай посилається на неї як LSI. LSA / LSI використовує SVD для декомпозиції матриці терміна-документа A на матрицю терміна-концепції U, матрицю єдиного значення S та матрицю V-концептуального документа у вигляді: A = USV '. На сторінці вікіпедії є детальний опис прихованого семантичного індексування .
Зокрема, хоча LSA та LSI використовують SVD, щоб зробити свою магію, існує обчислювально та концептуально простіший метод, який називається HAL (аналог мови гіперпростору), який просіює текст, відслідковуючи попередній та наступний контексти. Вектори витягуються з цих (часто зважених) матриць спільного виникнення, а конкретні слова вибираються для індексації семантичного простору. Багато в чому мені дано зрозуміти, що вона працює так само, як і LSA, не вимагаючи математично / концептуально складного кроку SVD. Докладніше див. У Lund & Burgess, 1996.
NMF і SVD - це алгоритми матричної факторизації. У Вікіпедії є відповідна інформація про NMF .
Інші відповіді охопили LSI / LSA ...