Не впевнений, що це правильний стек-сайт, але тут ідеться.
Як працює метод .симіліарності?
Нічого чудовий spaCy! Модель tfidf може бути простішою, але w2v лише з одним рядком коду ?!
У своєму підручнику з 10 рядків про spaCy andrazhribernik покажіть нам метод подібності, який можна запускати на лексемах, сентах, фрагментах слів та документах.
Після nlp = spacy.load('en')
і doc = nlp(raw_text)
ми можемо робити запити на подібність між маркерами та фрагментами. Однак, що розраховується поза кадром у цьому .similarity
методі?
SpaCy вже неймовірно простий .vector
, який обчислює вектор w2v, підготовлений з моделі GloVe (наскільки класним буде .tfidf
чи .fasttext
метод?).
Чи модель просто обчислює схожість косинуса між цими двома w2v, .vector, векторами або порівнює якусь іншу матрицю? Специфікація не чітка в документації ; будь-яка допомога вдячна!