Запитання з тегом «nlp»

Обробка природної мови (NLP) - це підполе штучного інтелекту, яке передбачає перетворення або вилучення корисної інформації з даних природної мови. Методи включають машинне навчання та підходи, засновані на правилах.

18
Як Google "Ви мали на увазі?" Алгоритм роботи?
Я розробляв внутрішній веб-сайт для інструменту управління портфелем. Дуже багато текстових даних, назв компаній тощо. Я був дуже вражений можливістю пошукових систем дуже швидко відповідати на запити "Чи мав ви на увазі: xxxx". Мені потрібно вміти інтелектуально приймати запит користувача та відповідати не лише непростими результатами пошуку, але й запитом …


10
Java Stanford NLP: Частина мовленнєвих лейблів?
Стенфордський НЛП, демонструваний тут , дає такий результат: Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./. Що означають теги Частина мови? Я не можу знайти офіційний список. Це власна система Стенфорда, або вони використовують універсальні теги? (Що JJ, наприклад,?) Крім того, коли я перебираю речення, шукаю іменники, наприклад, я закінчую щось на …

15
Визначення складів у слові
Мені потрібно знайти досить ефективний спосіб виявлення складів у слові. Наприклад, Невидимий -> in-vi-sib-le Є деякі правила конспектування, які можна використовувати: V CV VC CVC CCV CCCV CCCC CVCC * де V - голосний, а C - приголосний. Наприклад, Вимова (5 Pro-nun-ci-a -ation; CV-CVC-CV-V-CVC) Я спробував декілька методів, серед яких …


6
Як Apple знаходить дати, час та адреси в електронних листах?
У клієнті електронної пошти iOS, коли електронний лист містить дату, час або місцеположення, текст стає гіперпосиланням, і можна створити зустріч або переглянути карту, просто натиснувши посилання. Він працює не лише для електронної пошти англійською мовою, але й іншими мовами. Я люблю цю особливість і хотів би зрозуміти, як вони це …

11
Як позбутися пунктуації за допомогою токенізатора NLTK?
Я тільки починаю використовувати NLTK і не зовсім розумію, як отримати список слів з тексту. Якщо я використовую nltk.word_tokenize(), я отримую список слів і розділові знаки. Мені потрібні лише слова. Як я можу позбутися пунктуації? Також word_tokenizeне працює з кількома реченнями: крапки додаються до останнього слова.
125 python  nlp  tokenize  nltk 


2
Java або Python для обробки природних мов [закрито]
Закрито . Це питання ґрунтується на думці . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб на нього можна було відповісти фактами та цитатами, відредагувавши цю публікацію . Закрито 6 років тому . Удосконаліть це питання Мені хотілося б знати, яка мова програмування краще для обробки природних …
112 java  python  nlp 

21
Як зробити слово «Стермінг» чи «лематизацію»?
Я спробував PorterStemmer і Snowball, але обидва не працюють над усіма словами, пропускаючи деякі дуже поширені. Мої тестові слова: " коти, що бігали, спіткали кактуси спільнот кактусів ", і обидва отримують менше половини. Дивитися також: Алгоритм створіння, що створює реальні слова Stemming - приклади коду чи проекти з відкритим кодом?

4
Як обчислити точність, відкликання, точність та f1-бал для багатокласового випадку за допомогою scikit?
Я працюю над проблемою аналізу настроїв, дані виглядають так: label instances 5 1190 4 838 3 239 1 204 2 127 Таким чином, мої дані незбалансовані, оскільки 1190 instancesпозначено міткою 5. Для класифікації Im використовують SVC scikit . Проблема полягає в тому, що я не знаю, як правильно врівноважувати свої …

3
Як тренувати Стенфордський парсер з Genia Corpus?
У мене є проблеми зі створення нової моделі для Stanford Parser. Я також завантажив останню версію зі Стенфорда: http://nlp.stanford.edu/software/lex-parser.shtml А ось Genia Corpus у 2 форматах, xml та ptb (Penn Treebank). Standford Parser може тренуватися з файлами ptd; тоді я завантажив Genia Corpus, бо хочу працювати з біомедичним текстом: http://categorizer.tmit.bme.hu/~illes/genia_ptb/ …
93 java  nlp  stanford-nlp 

23
Як я можу правильно поставити слово перед префіксом "a" та "an"?
У мене є програма .NET, де за іменником я хочу, щоб він правильно додавав це слово перед "a" або "an". Як би я це зробив? Перш ніж подумати, що відповідь полягає в тому, щоб просто перевірити, чи перша буква є голосною, розгляньте такі фрази, як: чесна помилка вживаний автомобіль
93 c#  nlp  linguistics 


3
Чи є хороша бібліотека для обробки природних мов [закрито]
В даний час це питання не підходить для нашого формату запитань та відповідей. Ми очікуємо, що відповіді будуть підтверджені фактами, посиланнями чи експертизою, але це питання, швидше за все, вимагатиме дебатів, аргументів, опитування чи розширеного обговорення. Якщо ви вважаєте, що це питання можна покращити і, можливо, знову відкрити, відвідайте довідковий …
90 java  nlp 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.