Я використовував wget для завантаження html-файлів, де зберігаються зображення у файлі?


15

Firefox завантажувався дуже повільно, тому я вирішив використовувати wgetдля збереження файлів HTML. Я використав таку команду,

wget http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Файли збережені в моїй домашній папці. Але я не знаю, де зберігаються зображення. Мені потрібно їх використовувати Anki.

То де зберігаються зображення?


Ця стаття пояснює варіанти та наскільки вони корисні.
Вільф

Відповіді:


34

Я вважаю за краще використовувати --page-requisites( -pкоротко) замість -rцього, оскільки він завантажує все, що потрібна для відображення сторінки, але жодних інших сторінок, і мені не потрібно думати, які саме файли я хочу.

Насправді я зазвичай використовую щось подібне

wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Це означає:

  • -E: Додайте .htmlдо імені файлу, якщо це файл HTML, але не закінчується .htmlчи подібним
  • -H: Завантажуйте файли і з інших хостів
  • -k: Після завантаження конвертуйте будь-яке посилання в ньому, щоб вони вказували на завантажені файли
  • -p: Завантажте все, що потрібно для належного перегляду в режимі офлайн

Я прийшов сюди шукати -H, і з радістю дізнався про -Eі -kтеж. Спасибі!
Чарльз Клейтон

2

використання параметра -r повинно дозволяти wget завантажувати всю папку, включаючи ваші зображення.

wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

2

Завантаження файлів зображень також окремо

Я думаю, що ця команда може вас почати.

 wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Це дозволяє вказати місце для збереження зображень та типи файлів, які ви бажаєте. Можливо, завантажувати зображення як такі простіше.

Джерело :

-r дозволяє рекурсивне пошук. Для отримання додаткової інформації див. Рекурсивне завантаження.

-P встановлює префікс каталогу, куди зберігаються всі файли та каталоги.

-Встановлює білий список для отримання лише певних типів файлів. Рядки та шаблони приймаються, і обидва можуть використовуватися у списку, розділеному комами (як показано вище). Додаткову інформацію див. У розділі Типи файлів.

Копіювання файлів зображень із вашої папки

Я помітив, що веб-сайт використовує файли зображень PNG. Ви можете просто скопіювати їх із своєї папки. Це слід запустити у папці, де ви зберігали веб-сторінку.

find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;

1

Wget просто завантажує HTML-файл сторінки, а не зображення на сторінці, оскільки зображення в HTML-файлі сторінки записуються як URL-адреси. Щоб зробити те, що ви хочете, використовуйте -R(рекурсивний), -Aпараметр із суфіксами файлу зображення, --no-parentпараметр, щоб він не піднімався, та --levelопцію з 1.

Конкретно wget -R -A .jpg,.png,.gif --no-parent --level <url>

Ще краще, що у більшості браузерів є методи збереження сторінок для перегляду в режимі офлайн .

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.