Як обійти відсутні "останні змінені" заголовки?


13

Я бігаю wgetтак:

wget --mirror --adjust-extension --convert-links --no-cookies http://tshepang.net -o log-main

Я отримую купу таких повідомлень:

Last-modified header missing -- time-stamps turned off.

Я думаю, це означає, що сторінки продовжують завантажуватися, навіть якщо я їх локально.

ПРИМІТКА . Я хочу цього зробити так, щоб мені не довелося повторно завантажувати наявні файли кожного разу, коли я запускаю командне дзеркало.


Ви власник сторінки (якщо вона дійсно є tshepang.net). Якщо так, чи є веб-сервер apache і чи маєте ви якийсь контроль над його конфігурацією? Або, принаймні, увімкнено .htaccess з дозволом заміни опцій?
forcefsck

@forcefsck: Так, сайт управляє Posterous. У них є API для читання всіх постів, але це крива навчання для мене цих веб-технологій.
thepang

Відповіді:


10

Ви спробували додати -cпараметр?

Витяг з керівництва wget:

-c - продовжувати

Починаючи з Wget 1.7, якщо ви використовуєте -c для не порожнього файлу, і виявляється, що сервер не підтримує продовження завантаження, Wget відмовиться починати завантаження з нуля, що ефективно знищить існуючий вміст. Якщо ви дійсно хочете, щоб завантаження почалося з нуля, видаліть файл.

Також, починаючи з Wget 1.7, якщо ви використовуєте -c у файлі, який має однаковий розмір, як файл на сервері, Wget відмовиться завантажувати файл та друкувати пояснювальне повідомлення. Те саме відбувається, коли файл на сервері менше, ніж локально (імовірно, тому, що він був змінений на сервері з моменту останньої спроби завантаження) --- тому, що "продовження" не має сенсу, завантаження не відбувається.

З іншого боку монети, використовуючи -c, будь-який файл, більший на сервері, ніж локальний, вважатиметься неповним завантаженням, і лише "байт" (довжина (віддалений) - довжина (локальний)) "буде завантажений і розміщений на ньому кінець локального файлу. Така поведінка може бути бажаною у певних випадках --- наприклад, ви можете використовувати wget -c для завантаження лише нової частини, доданої до збору даних або файлу журналу.

Наскільки мені відомо, він повинен пропускати вже завантажені файли і однакового розміру.


Що робити, якщо файл менший?
CJ7
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.