Запитання з тегом «cosine-similarity»

2
Чи однакова косинусна схожість на нормалізовану l2 евклідову відстань?
Ідентичний сенс, що він буде робити ідентичні результати для ранжирування подібності між вектором ¯u і набором векторами V . У мене є векторна космічна модель, яка в якості параметрів має міру відстані (евклідова відстань, схожість косинусів) і техніку нормалізації (немає, l1, l2). Наскільки я розумію, результати налаштувань [косинус, жоден] повинні …

1
Чи є зв’язок між косинусною схожістю, грунтовою кореляцією та z-балом?
Мені цікаво, чи є якийсь зв’язок серед цих 3 заходів. Я, здається, не можу зв’язатись між ними, посилаючись на визначення (можливо, тому, що я новачок у цих визначеннях і маю дещо нерозумілий час, що їх розуміє). Я знаю, що діапазон подібності косинусів може бути від 0 до 1, і кореляція …

4
Тлумачення негативної косинусної подібності
Моє запитання може бути дурним. Тому я заздалегідь прошу вибачення. Я намагався використовувати модель GLOVE, попередньо підготовлену групою Stanford NLP ( посилання ). Однак я помітив, що результати моєї подібності показали деякі негативні цифри. Це відразу ж підштовхнуло мене переглянути файл файлів даних word-vector. Мабуть, значення у векторах слова мали …

1
Автоматичне вилучення ключових слів: використання схожих косинусів як функцій
У мене є документ-термін матриця , і тепер я хотів би отримати ключові слова для кожного документа з контрольованим методом навчання (SVM, Naive Bayes, ...). У цій моделі я вже використовую Tf-idf, Pos тег, ...ММM Але зараз мені цікаво про некси. У мене є матриця із косинусною схожістю між термінами.ССC …

1
Алгоритми вбудовування в слово з точки зору продуктивності
Я намагаюся вкласти приблизно 60 мільйонів фраз у векторний простір , а потім обчислити схожість косинусів між ними. Я використовую sklearn CountVectorizerз спеціально вбудованою функцією токенізатора, яка створює уніграми та біграми. Виявляється, що для отримання значущих уявлень, я повинен передбачити величезну кількість стовпців, лінійних за кількістю рядків. Це призводить до …

3
K - означає косинусну схожість проти евклідової відстані (LSA)
Я використовую латентний семантичний аналіз для представлення корпусу документів у просторі нижчих розмірів. Я хочу класифікувати ці документи на дві групи за допомогою k-засобів. Кілька років тому я робив це, використовуючи gensim Python і писав власний алгоритм k-означає. Я визначив центроїди кластера за евклідовою відстані, але потім згрупував кожен документ …

2
Як змінюється подібність косинусу після лінійного перетворення?
Чи є математичний зв’язок між: косинусна схожість ім'я двох векторів і , ісим( A , B )sim⁡(A,B)\operatorname{sim}(A, B)АAAБBB косинус подібності з і , неоднорідне масштабується з допомогою даної матриці ? Тут - задана діагональна матриця з нерівними елементами по діагоналі.сим( МА , МБ )sim⁡(MA,MB)\operatorname{sim}(MA, MB)АAAБBBМMMМMM Я намагався пройти обчислення, але …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.