Чи є статті чи дискусії щодо вилучення частини тексту, яка містить найбільше інформації про поточний документ.
Наприклад, у мене є великий корпус документів з одного домену. Є частини тексту, які містять ключову інформацію, про яку йдеться в одному документі. Я хочу витягти деякі з цих частин і використовувати їх як своєрідний підсумок тексту. Чи є корисна документація про те, як досягти чогось подібного.
Було б дуже корисно, якби хтось міг вказати мені на правильний напрямок того, що я повинен шукати чи прочитати, щоб отримати деяке розуміння роботи, яка, можливо, вже була зроблена у цій галузі обробки природних мов.