Моє запитання може бути дурним. Тому я заздалегідь прошу вибачення.
Я намагався використовувати модель GLOVE, попередньо підготовлену групою Stanford NLP ( посилання ). Однак я помітив, що результати моєї подібності показали деякі негативні цифри.
Це відразу ж підштовхнуло мене переглянути файл файлів даних word-vector. Мабуть, значення у векторах слова мали бути негативними. Це пояснило, чому я бачив негативні косинусні подібності.
Я звик до поняття косинусної подібності векторів частот, значення яких обмежені в [0, 1]. Я знаю на факт, що крапка добутку та косинус можуть бути позитивними чи негативними залежно від кута між вектором. Але мені справді важко зрозуміти та інтерпретувати цю негативну косинусну подібність.
Наприклад, якщо у мене є пара слів, що дають подібність -0,1, чи вони менш схожі, ніж інша пара, схожість якої становить 0,05? Як щодо порівняння подібності від -0,9 до 0,8?
Або варто просто подивитися на абсолютне значення мінімальної різниці кутів від ? Абсолютне значення балів?
Велике спасибі
An angular-type similarity coefficient between two vectors. It is like correlation, only without centering the vectors.
Єдина відмінність між ними полягає в тому, що у кореляційних відхиленнях (моменти), які перетинаються множиною, - від середнього значення, тоді як у косинусних відхиленнях від початкового 0 - тобто вони є такими, якими вони є значення. .