Я намагаюся створити набір даних на кількох файлах журналів одного з наших продуктів.
Різні файли журналів мають власний макет і власний вміст; Я успішно згрупував їх разом, залишився лише один крок ...
Дійсно, журнал "повідомлення" - найкраща інформація. У мене немає вичерпного списку всіх цих повідомлень, і це погана ідея жорсткого коду, заснованого на таких, оскільки цей список може змінюватися щодня.
Що я хотів би зробити, це відокремити текст відмітки від тексту значення (наприклад: "Завантажений файл XXX" (ідентифікація: "Завантажений файл", значення: "XXX")). На жаль, цей приклад простий, і в реальному світі існують різні схеми, а іноді і декілька значень.
Я думав про використання ядер рядків, але він призначений для кластеризації ... і клаузування тут не застосовується (я не знаю кількість різних типів повідомлень і навіть всьому, це було б занадто багато).
У вас є ідея?
Спасибі за вашу допомогу.
PS: Для тих, хто програмує, це можна легше зрозуміти. Скажімо, що код містить журнали printf ("blabla% s", "xxx") -> я б хотів, щоб "blabla" і "xxx" були відокремлені