Як отримати віддалений розмір файлу зі сценарію оболонки?

Question 1

Чи є спосіб отримати розмір віддаленого файлу, наприклад

http://api.twitter.com/1/statuses/public_timeline.json

у сценарії оболонки?

Question 2

Ви можете завантажити файл і отримати його розмір. Але ми можемо зробити краще.

Використовуйте curl, щоб отримати лише заголовок відповіді, використовуючи -Iопцію.

У заголовку відповіді знайдіть, за Content-Length:яким слідуватиме розмір файлу в байтах.

$ URL="http://api.twitter.com/1/statuses/public_timeline.json"
$ curl -sI $URL | grep -i Content-Length
Content-Length: 134

Щоб отримати розмір, використовуйте фільтр, щоб витягти числову частину з вихідних даних:

$ curl -sI $URL | grep -i Content-Length | awk '{print $2}'
134

Question 3

Два застереження до інших відповідей:

Деякі сервери не повертають правильну довжину вмісту для запиту HEAD, тому вам може знадобитися виконати повне завантаження.
Швидше за все, ви отримаєте нереально велику відповідь (порівняно із сучасним браузером), якщо не вказати заголовки gzip / deflate.

Крім того, ви можете зробити це без grep / awk або трубопроводів:

curl 'http://api.twitter.com/1/statuses/public_timeline.json' --location --silent --write-out 'size_download=%{size_download}\n' --output /dev/null

І той самий запит зі стисненням:

curl 'http://api.twitter.com/1/statuses/public_timeline.json' --location --silent  -H 'Accept-Encoding: gzip,deflate' --write-out 'size_download=%{size_download}\n' --output /dev/null

Question 4

Подібно до відповіді кодексу , але без заклику grep:

curl -sI http://api.twitter.com/1/statuses/public_timeline.json | awk '/Content-Length/ { print $2 }'

Question 5

Попередні відповіді не спрацюють, якщо є переспрямування. Наприклад, якщо хтось хоче розмір debian iso DVD, він повинен використовувати параметр --location, інакше повідомлений розмір може бути розміром 302 Moved Temporarilyтіла відповіді, а не реального файлу.
Припустимо, у вас є така URL-адреса:

$ url=http://cdimage.debian.org/debian-cd/8.1.0/amd64/iso-dvd/debian-8.1.0-amd64-DVD-1.iso

За допомогою завивки ви можете отримати:

$ curl --head --location ${url}
HTTP/1.0 302 Moved Temporarily
...
Content-Type: text/html; charset=iso-8859-1
...

HTTP/1.0 200 OK
...
Content-Length: 3994091520
...
Content-Type: application/x-iso9660-image
...

Ось чому я віддаю перевагу використанню HEAD, що є псевдонімом lwp-requestкоманди з пакета libwww-perl (на debian). Ще однією його перевагою є те, що він позбавляє зайвих символів \ r , що полегшує подальшу обробку рядків.

Отже, щоб отримати розмір debian iso DVD, можна зробити, наприклад:

$ size=$(HEAD ${url})
$ size=${size##*Content-Length: }
$ size=${size%%[[:space:]]*}

Будь ласка, зверніть увагу, що:

цей метод вимагатиме запуску лише одного процесу
він буде працювати лише з bash, оскільки використовується спеціальний синтаксис розширення

Для інших оболонок, можливо, доведеться вдатися до sed, awk, grep та ін ..

Question 6

Я думаю, що найпростіший спосіб зробити це:

використовуйте curl для запуску в беззвучному режимі -s,
тягніть лише заголовки -I(щоб уникнути завантаження цілого файлу)
потім виконайте grep, нечутливий до регістру -i
і поверніть другий аргумент, використовуючи awk $2.
вихід повертається як bytes

Приклади:

curl -sI http://api.twitter.com/1/statuses/public_timeline.json | grep -i content-length | awk '{print $2}'

//output: 52

або

curl -sI https://code.jquery.com/jquery-3.1.1.min.js | grep -i content-length | awk '{print $2}'

//output: 86709

або

curl -sI http://download.thinkbroadband.com/1GB.zip | grep -i content-length | awk '{print $2}'

//output: 1073741824

Показати як кілобайт / мегабайт

Якщо ви хочете показати розмір у кілобайтах, змініть awk на:

awk '{print $2/1024}'

або мегабайт

awk '{print $2/1024/1024}'

Question 7

Прийняте рішення для мене не працювало, це:

curl -s https://code.jquery.com/jquery-3.1.1.min.js | wc -c

Question 8

У мене є функція оболонки, заснована на відповіді codaddict , яка надає розмір віддаленого файлу в зручному для читання форматі:

remote_file_size () {
  printf "%q" "$*"           |
    xargs curl -sI           |
    grep Content-Length      |
    awk '{print $2}'         |
    tr -d '\040\011\012\015' |
    gnumfmt --to=iec-i --suffix=B # the `g' prefix on `numfmt' is only for systems
  # ^                             # that lack the GNU coreutils by default, i.e.,
  # |                             # non-Linux systems
  # |
  # |                             # in other words, if you're on Linux, remove this
  # |                             # letter `g'; if you're on BSD or Mac, install the GNU coreutils
} # |                                        |
  # +----------------------------------------+

Question 9

Поєднати все вищезазначене для мене працює:

URL="http://cdimage.debian.org/debian-cd/current/i386/iso-dvd/debian-9.5.0-i386-DVD-1.iso"
curl --head --silent --location "$URL" | grep -i "content-length:" | tr -d " \t" | cut -d ':' -f 2

Це поверне лише довжину вмісту в байтах:

3767500800

Question 10

Я використовую ось так ([Cc]ontent-[Ll]ength:), тому що я отримав сервер, що надає кілька символів довжини вмісту при відповіді заголовка

curl -sI "http://someserver.com/hls/125454.ts" | grep [Cc]ontent-[Ll]ength: | awk '{ print $2 }'

Accept-Ranges: bytes Access-Control-Expose-Headers: Date, Server, Content-Type, Content-Length Server: WowzaStreamingEngine/4.5.0 Cache-Control: no-cache Access-Control-Allow-Origin: * Access-Control-Allow-Credentials: true Access-Control-Allow-Methods: OPTIONS, GET, POST, HEAD Access-Control-Allow-Headers: Content-Type, User-Agent, If-Modified-Since, Cache-Control, Range Date: Tue, 10 Jan 2017 01:56:08 GMT Content-Type: video/MP2T Content-Length: 666460

Question 11

Це покаже вам детальну інформацію про поточне завантаження

Вам просто потрібно вказати URL-адресу, як показано в прикладі нижче.

$ curl -O -w 'We downloaded %{size_download} bytes\n' 
https://cmake.org/files/v3.8/cmake-3.8.2.tar.gz

вихід

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100 7328k  100 7328k    0     0   244k      0  0:00:29  0:00:29 --:--:--  365k
We downloaded 7504706 bytes

Для автоматизованих цілей вам просто потрібно додати команду до файлу сценарію.

Question 12

інше рішення:

ssh userName@IP ls -s PATH | grep FILENAME | awk '{print$1}'

дає вам розмір у КБ