У мене є ряд веб-сайтів, які я архівую, щоб зберегти там багато пов'язаних файлів, зокрема, кількість PDF-файлів.
У мене не було проблем із використанням сканера Heritrix для збору сайтів. Однак я не знайшов хорошого рішення для вилучення файлів з цих .warcфайлів.
Хтось із них має досвід роботи з цим чи має переважний спосіб вивести ці окремі файли?
.warcархів, який він може розпакувати (p7zip -d web-archive.warc). Вам вдалося витягнути окремі файли за допомогою 7-Zip?