У мене є список слів, що належать до різних самовизначених категорій. Кожна категорія має свій рисунок (наприклад, одна має фіксовану довжину зі спеціальними символами, інша існує символами, які зустрічаються лише в цій категорії "слово", ...).
Наприклад:
"ABC" -> type1
"ACC" -> type1
"a8 219" -> type2
"c 827" -> type2
"ASDF 123" -> type2
"123123" -> type3
...
Я шукаю техніку машинного навчання, щоб самостійно засвоїти ці зразки на основі даних про навчання. Я вже намагався самостійно визначити деякі змінні предиктора (наприклад, довжина слова, кількість спеціальних символів, ...), а потім застосував Neural-Networks для вивчення та прогнозування категорії. Але це акутно не те, що я хочу. Я хочу, щоб методика вивчила шаблон для кожної категорії самостійно - навіть вивчити шаблони, про які я ніколи не замислювався.
Тому я даю дані навчання алгоритму (що складається з прикладів категорій слів) і хочу, щоб він вивчив зразки для кожної категорії, щоб передбачити пізніше категорію з подібних або рівних слів.
Чи є сучасний спосіб це зробити?
Спасибі за вашу допомогу