Нещодавно я почав експериментувати з обробкою природних мов (NLP) за допомогою CoreNLP Стенфорда , і мені цікаво, які є стандартні способи зберігання даних, розібраних у NLP, для чогось на зразок програми для видобутку тексту?
Один із способів, на який я думав, може бути цікавим - зберігати дітей як список суміжності та добре використовувати рекурсивні запити (Postgres підтримує це, і я виявив, що це працює дуже добре).
Але я припускаю, що, мабуть, існує багато стандартних способів зробити це залежно від того, який аналіз робиться, які були прийняті людьми, які працюють у цій галузі протягом багатьох років. Отже, які є стандартні стратегії збереження для аналізуваних даних NLP і як вони використовуються?