Ідентичний сенс, що він буде робити ідентичні результати для ранжирування подібності між вектором ¯u і набором векторами V .
У мене є векторна космічна модель, яка в якості параметрів має міру відстані (евклідова відстань, схожість косинусів) і техніку нормалізації (немає, l1, l2). Наскільки я розумію, результати налаштувань [косинус, жоден] повинні бути ідентичними або, принаймні, дійсно схожими на [евклідов, l2], але вони не є.
Насправді є гарна ймовірність, що система все-таки баггі - або я щось критично не вірю?
редагувати: я забув зазначити, що вектори засновані на підрахунку слів із документів у корпусі. З огляду на документ-запит (який я також перетворюю у вектор лічильників слів), я хочу знайти документ із мого корпусу, який найбільш схожий на нього.
Просто обчислення евклідової відстані - це прямий показник вперед, але в такому завданні, над яким я працюю, подібність косинусів часто віддається перевазі як показник подібності, оскільки вектори, які відрізняються лише за довжиною, все ще вважаються рівними. Документ з найменшою схожістю на відстань / косинус вважається найбільш подібним.