Отже, я тільки починаю дізнаватися, як нейронна мережа може діяти для розпізнавання шаблонів і категоризації входів, і я бачила, як штучна нейронна мережа може розбирати дані зображення та класифікувати зображення ( демонстрацію з convnetjs ) та ключ там полягає в тому, щоб зменшити вибірку зображення, і кожен піксель стимулює один вхідний нейрон в мережу.
Однак я намагаюся обернути голову, якщо це можливо зробити за допомогою рядкових входів? Випадок використання, який я отримав, - це "механізм рекомендацій" для фільмів, які користувач переглянув. У фільмах є багато рядкових даних (назва, сюжет, теги), і я міг би уявити, як "зменшити розмір" тексту до кількох ключових слів, які описують цей фільм, але навіть якщо я розбираю п’ять перших слів, які описують цей фільм, я думаю, мені потрібні вхідні нейрони для кожного англійського слова, щоб порівняти набір фільмів? Я міг би обмежити вхідні нейрони лише словами, що використовуються в наборі, але чи міг би він рости / навчатися, додаючи нові фільми (користувач дивиться новий фільм, з новими словами)? Більшість бібліотек, які я бачив, не дозволяють додавати нові нейрони після навчання системи?
Чи є стандартний спосіб відображення даних рядка / слова / символів на входи в нейронну мережу? Або нейронна мережа насправді не є правильним інструментом для розбору подібних рядкових даних (який кращий інструмент для відповідності шаблонів у рядкових даних)?