Запитання з тегом «nlp»

Обробка природних мов (NLP) - це сфера інформатики, штучного інтелекту та лінгвістики, що стосується взаємодії комп'ютерів та людських (природних) мов. Таким чином, НЛП пов'язаний із сферою взаємодії людина-комп'ютер. Багато проблем, пов'язаних з NLP, пов'язані з розумінням природних мов, тобто з можливістю комп'ютерів отримувати значення від людського або природного мовлення, а інші передбачають генерування природних мов.

2
Витягніть канонічну струну зі списку галасливих струн
У мене тисячі списків рядків, і кожен список містить близько 10 рядків. Більшість рядків у даному списку дуже схожі, хоча деякі рядки (рідко) повністю не пов'язані з іншими, а деякі рядки містять нерелевантні слова. Їх можна вважати галасливими варіаціями канонічної струни. Я шукаю алгоритм чи бібліотеку, які перетворять кожен список …

1
Як визначити складність англійського речення?
Я працюю над додатком, щоб допомогти людям вивчати англійську мову як другу мову. Я підтвердив, що речення допомагають вивчати мову, надаючи додатковий контекст. Я зробив це, провівши невелике дослідження в класі 60 учнів. Я видобув понад сто тисяч речень з Вікіпедії для різних англійських слів (включаючи 800 слів Баррона і …

5
Як створити хороший список зупинок
Я шукаю підказки про те, як вилікувати список зупинок. Хтось знає / чи може хтось порекомендувати хороший метод вилучення списків зупинок із самого набору даних для попередньої обробки та фільтрації? Дані: величезна кількість введення людського тексту різної довжини (пошукові терміни та цілі речення (до 200 символів)) протягом кількох років. Текст …

1
Використання Vowpal Wabbit для NER
Vowpal Wabbit (VW), мабуть, підтримує функцію тегування послідовності через SEARN . Проблема полягає в тому, що я не можу ніде знайти докладний список параметрів з поясненнями та з деякими прикладами. Найкраще, що я міг знайти, це запис у блозі Зінкова з дуже коротким прикладом. Головна сторінка Вікі майже НЕ згадує …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.