Я створив кілька нейронних мереж (MLP (повністю підключений), Elman (повторюваний)) для різних завдань, таких як гра в понг, класифікація рукописних цифр та інше ...
Крім того, я спробував створити кілька первинних нейронних мереж, наприклад, для класифікації багатозначних рукописних нотаток, але я абсолютно новий для аналізу та кластеризації текстів, наприклад, у завданнях розпізнавання зображень / кластеризації можна покладатися на стандартизований ввід, наприклад, зображення розміром 25x25, RGB або відтінки сірого і так далі ... є багато функцій попереднього припущення.
Для видобутку тексту, наприклад, новинних статей, у вас постійно змінюється розмір вводу (різні слова, різні речення, різна довжина тексту, ...).
Як можна реалізувати сучасний інструмент видобутку тексту, використовуючи штучний інтелект, переважно нейронні мережі / СОМ?
На жаль, мені не вдалося знайти простих навчальних посібників для початку. Складні наукові праці важко читати і не найкращий варіант для вивчення теми (на мій погляд). Я вже читав досить багато робіт про MLP, техніку відміни, конволюційну нейронну мережу тощо, але мені не вдалося знайти основної теми щодо видобутку тексту - все, що я знайшов, був занадто високим рівнем для моїх дуже обмежених навичок видобутку тексту.