Запитання з тегом «information-retrieval»

11
Який найкращий спосіб обчислити тенденційні теми чи теги?
Багато сайтів пропонують статистику на кшталт "Найгарячіші теми за останні 24 години". Наприклад, Topix.com показує це у своєму розділі «Новини тенденцій». Там ви можете побачити теми, які найчастіше згадуються. Я також хочу обчислити такий "кайф" для теми. Як я міг це зробити? Алгоритм повинен набирати ваги тем, які завжди менш …

6
Python: tf-idf-cosine: щоб знайти схожість документа
Я дотримувався підручника, який був доступний у Частинах 1 та Частині 2 . На жаль, у автора не було часу для останнього розділу, який передбачав використання подібності косинусів, щоб насправді знайти відстань між двома документами. Я наслідував приклади в статті за допомогою наступного посилання від stackoverflow , включено код, згаданий …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.