Я намагаюся видалити стоп-слова, перш ніж виконувати моделювання теми. Я помітив, що деякі заперечувальні слова (ні, ні, ніколи, ні т. Д.) Зазвичай не вважаються словами стоп. Наприклад, NLTK, spacy та sklearn містять "not" у списках стоп-слов. Однак якщо ми видалимо "не" з цих пропозицій нижче, вони втрачають значне значення, і це було б не точно для моделювання теми чи аналізу настроїв.
1). StackOverflow is helpful => StackOverflow helpful
2). StackOverflow is not helpful => StackOverflow helpful
Чи може хто-небудь пояснити, чому ці слова заперечення зазвичай вважаються словами стоп?