Запитання з тегом «nlp»

Обробка природної мови (NLP) - це підполе штучного інтелекту, яке передбачає перетворення або вилучення корисної інформації з даних природної мови. Методи включають машинне навчання та підходи, засновані на правилах.


12
Аналіз настрою для Twitter у Python [закрито]
Зачинено. Це питання не відповідає вимогам щодо переповнення стека . Наразі відповіді не приймаються. Хочете покращити це питання? Оновіть питання, щоб воно було актуальним для переповнення стека. Закрито 5 років тому . Удосконалюйте це питання Я шукаю реалізацію з відкритим кодом, бажано в python, для аналізу текстових настроїв ( http://en.wikipedia.org/wiki/Sentiment_analysis …


4
Створення нового корпусу за допомогою NLTK
Я вважав, що часто відповідь на мій заголовок полягає в тому, щоб піти читати документацію, але я переглянув книгу НЛТК, але вона не дає відповіді. Я якось новачок у Python. У мене є купа .txtфайлів, і я хочу мати можливість використовувати функції корпусу, які NLTK надає для корпусу nltk_data. Я …
83 python  nlp  nltk  corpus 

3
Практичні приклади використання НЛТК [закрито]
В даний час це питання не підходить для нашого формату запитань та відповідей. Ми очікуємо, що відповіді будуть підтверджені фактами, посиланнями чи експертизою, але це питання, швидше за все, вимагатиме дебатів, аргументів, опитування чи розширеного обговорення. Якщо ви вважаєте, що це питання можна покращити і, можливо, знову відкрити, відвідайте довідковий …
78 python  nlp  nltk 

5
Розуміння min_df та max_df у scikit CountVectorizer
У мене є п’ять текстових файлів, які я ввожу в CountVectorizer. При зазначенні min_df та max_df для екземпляра CountVectorizer, що саме означає мінімальна / максимальна частота документа? Це частота слова у конкретному текстовому файлі чи частота слова у всьому загальному корпусі (5 текстових файлів)? Чим відрізняється, коли min_df та max_df …

5
Видалення зупинних слів за допомогою NLTK
Я намагаюся обробити введений користувачем текст, видаляючи стоп-слова за допомогою набору інструментів nltk, але при видаленні стоп-слова такі слова, як «та», «або», «не», видаляються. Я хочу, щоб ці слова були присутні після процесу видалення зупинки, оскільки вони є операторами, які потрібні для подальшої обробки тексту як запиту. Я не знаю, …
76 python  nlp  nltk  stop-words 

3
Штеммери проти лемматизаторів
Обробка природних мов (НЛП), особливо для англійської, перетворилася на стадію, коли стемінг став би архаїчною технологією, якщо існують "ідеальні" лематизатори. Це тому, що стовбури змінюють поверхневу форму слова / лексеми на деякі безглузді основи. Знову ж таки, визначення "ідеального" лематизатора є сумнівним, оскільки для різних завдань НЛП потрібен був би …

3
Як побудувати смисловий пошук даного домену
Є проблема, яку ми намагаємося вирішити, де ми хочемо зробити семантичний пошук на нашому наборі даних, тобто у нас є дані, що стосуються домену (приклад: пропозиції, що говорять про автомобілі) Наші дані - це лише купа пропозицій, і ми хочемо дати фразу і повернути пропозиції, які є: Подібна до цієї …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.