У мене є ряд веб-сайтів, які я архівую, щоб зберегти там багато пов'язаних файлів, зокрема, кількість PDF-файлів.
У мене не було проблем із використанням сканера Heritrix для збору сайтів. Однак я не знайшов хорошого рішення для вилучення файлів з цих .warc
файлів.
Хтось із них має досвід роботи з цим чи має переважний спосіб вивести ці окремі файли?
.warc
архів, який він може розпакувати (p7zip -d web-archive.warc
). Вам вдалося витягнути окремі файли за допомогою 7-Zip?