Отримайте час модифікації віддаленого файлу через HTTP у сценарії Bash

Я створюю простий сценарій Bash, щоб витягнути час / дату зміни файлу віддаленого файлу через HTTP.

Приклад файлу: http://example.com/bar/example.pdf

Це можна зробити, не завантажуючи власне файл? Якщо ні, то яка найкраща альтернатива?

bash http

Відповіді:

Якщо чесно, не прямо.

Вам потрібно буде отримати дані з віддаленого сайту, щоб отримати інформацію про файл. Зазвичай це робиться із HEADзапитом, але деякі (більшість?) Серверів не реалізували його правильно та доставляють весь файл, як і GETзапит. Якщо ви curlвстановили:

curl -s -v -X HEAD http://foo.com/bar/baz.pdf 2>&1 | grep '^< Last-Modified:'

може дати вам те, що ви хочете, але, як було сказано, це дуже залежить від сервера.

— Карстен С.
джерело

"Найбільше"? Я був би здивований, якби хтось із популярних серверів HTTP таким чином порушив протокол.

— користувач1686

Це мало змінити звичайно. Деякий час тому, коли я мав справу з такими проблемами, було так. Однак час проходить. Якщо ви знайдете сайти, на яких все ще працює cgi незалежно від "додатків", вони швидше за все не обробляють HEAD. Тим не менш, і ці сайти дадуть вам результат, оскільки вони повинні доставити все.

— Карстен С.

Я пропоную використовувати --headваріант, а не -X HEADйого більш короткий, щоб команда стала: curl -s -v --head http://foo.com/bar/baz.pdf 2>&1 | grep '^< Last-Modified:'

— Gautham C.

curl -svX HEADще більш короткий ...

— Карстен С.

@ Привіт-Ангел Ні, там взагалі немає. Wget використовує заголовок If-Modified-Since, щоб сказати, "hey надсилає цей файл лише в тому випадку, якщо він є новішим, ніж ця дата", тоді сервер повинен реалізувати та поважати цей заголовок. Якщо сервер вважає, що файл не змінився, він надсилає відповідь 304 NOT MODIFIED.

— antonagestam

У відповіді сервера зазвичай є Last-Modifiedполе, ви можете перевірити його, не завантажуючи файл. Немає необхідності у використанні -X HEAD, немає спеціальної опції -Iдля цього (на -sПригнічує висновок про ході роботи ) :

curl -sI http://example.com/bar/example.pdf | grep -i Last-Modified

Також у моєму випадку не встановлено завиток (я роблю сценарій для вбудованого пристрою) , просто wget. Шлях із wget є:

wget --server-response --spider http://example.com/bar/example.pdf 2>&1 | grep -i Last-Modified

У --server-responseдрукує заголовки, і --spiderопція змушує не завантажувати сторінки, а перевірити їх існування.

— Привіт-Ангел
джерело

Це curlкраща відповідь, ніж прийнята. Можливо, використовуючи, grep -iоскільки часто "останній модифікований" має інший випадок.

— not2qubit

@ not2qubit thx для замітки відредаговано.

— Привіт-Ангел