Якщо ви використовуєте розширення дужок wget
, ви можете легко отримувати послідовно пронумеровані зображення:
$ wget 'http://www.iqandreas.com/sample-images/100-100-color/'{90..110}'.jpg'
Він витягує перші 10 файлів , пронумерованих 90.jpg
в 99.jpg
тільки штраф, але 100.jpg
і далі повертає 404: Немає запису знайдено помилку ( у мене тільки 100 зображень , що зберігаються на сервері). Ці неіснуючі файли стають більшою проблемою, якщо ви користуєтеся більшим діапазоном, наприклад {00..200}
, зі 100 неіснуючими файлами, це збільшує час виконання сценарію і навіть може стати невеликим тягарем (або принаймні роздратування) на сервер.
Чи є спосіб wget
зупинитись після отримання першої помилки 404? (а ще краще, два поспіль, якщо в діапазоні з іншої причини був файл, що відсутній) У відповіді не потрібно використовувати розширення дужок; петлі теж тонкі.
1, 2 or even n failures
це не правильний шлях, коли ви знаєте[begin .. end]
індекси. Чому б ви вказали[1..200]
діапазон, коли знаєте, що в ньому всього 100 зображень[1..100]
. Я думаю, ви можете спробувати GNUparallel
для одночасних запитів, щоб прискорити процес.