Запитання з тегом «text-mining»

Посилається на підмножину розробки даних, що стосується вилучення інформації з даних у вигляді тексту шляхом розпізнавання шаблонів. Завданням видобутку тексту часто є автоматичне класифікацію даного документа на одну з ряду категорій та динамічне вдосконалення цієї продуктивності, що робить її прикладом машинного навчання. Одним із прикладів цього виду пошуку тексту є фільтри спаму, які використовуються для електронної пошти.

1
Як визначити складність англійського речення?
Я працюю над додатком, щоб допомогти людям вивчати англійську мову як другу мову. Я підтвердив, що речення допомагають вивчати мову, надаючи додатковий контекст. Я зробив це, провівши невелике дослідження в класі 60 учнів. Я видобув понад сто тисяч речень з Вікіпедії для різних англійських слів (включаючи 800 слів Баррона і …

1
Скільки навчальних даних потрібно word2vec?
Я хотів би порівняти різницю між одним і тим же словом, згаданим у різних джерелах. Тобто, як автори відрізняються у вживанні неправильно визначених слів, таких як "демократія". Короткий план був Візьміть книги, в яких згадується термін "демократія", як звичайний текст У кожній книзі замініть democracyнаdemocracy_%AuthorName% Навчіть word2vecмодель цих книг Обчисліть …

2
які методи машинного / глибокого навчання / nlp використовуються для класифікації певних слів як імені, мобільного номера, адреси, електронної пошти, штату, округу, міста тощо
Я намагаюся створити інтелектуальну модель, яка може сканувати набір слів або рядків і класифікувати їх як імена, мобільні номери, адреси, міста, штати, країни та інші об'єкти за допомогою машинного навчання або глибокого навчання. Я шукав підходи, але, на жаль, не знайшов жодного підходу. Я намагався вбудовувати мішок із слів моделі …

4
Запропонувати набори навчальних наборів текстів класифікатора
Які вільно доступні набори даних я можу використовувати для тренування класифікатора тексту? Ми намагаємось посилити залучення наших користувачів, рекомендуючи для нього найпов'язаніший вміст, тому ми подумали, що якщо ми класифікуємо наш вміст на основі заздалегідь визначеного пакету слів, ми можемо рекомендувати йому залучати вміст, отримуючи його відгуки про випадкову кількість …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.