Додайте стовпчик чисел у оболонці Unix


198

З огляду на список файлів у files.txt, я можу отримати такий перелік їх розмірів:

cat files.txt | xargs ls -l | cut -c 23-30

яка виробляє щось подібне:

  151552
  319488
 1536000
  225280

Як я можу отримати загальну кількість цих чисел?

Відповіді:


383
... | paste -sd+ - | bc

є найкоротшим, який я знайшов (із блогу командного рядка UNIX ).

Редагувати: додано -аргумент для портативності, дякую @Dogbert та @Owen.


Приємно. Потрібно останнє - також на Соляріс
Оуен Б

8
alias sum="paste -sd+ - | bc"додано до завершення оболонки, спасибі товариш
slf

. . .| x=$(echo <(cat)); echo $((0+${x// /+}+0))якщо ви хочете весь бас весь час:
qneill

13
@slf, дивись, ти щойно перевантажений/usr/bin/sum
qneill

3
Остерігайтеся, bcнедоступний у деяких системах! awk, з іншого боку, я вважаю, необхідний для дотримання POSIX.
vktec

154

Ось іде

cat files.txt | xargs ls -l | cut -c 23-30 | 
  awk '{total = total + $1}END{print total}'

34
Використання awk - прекрасна ідея, але навіщо тримати cut? Це передбачуваний номер стовпця, тому використовуйте... | xargs ls -l | awk '{total = total + $5}{END{print total}'
dmckee --- колишнє кошеня-модератор

3
Ви, звичайно, правильні - було простіше просто додати до кінця те, що вже було там :-)
Грег Рейнольдс

2
Одна дужка занадто багато у відповіді @ dmckee :)
Д-р Ян-Філіп Геррк

7
Щоб зробити це трохи коротше, ви можете використовувати total+=$1замістьtotal = total + $1
vktec

10

Замість використання cut, щоб отримати розмір файлу з виводу ls -l , ви можете використовувати безпосередньо:

$ cat files.txt | xargs ls -l | awk '{total += $5} END {print "Total:", total, "bytes"}'

Awk трактує "$ 5" як п'яту колонку. Це стовпчик з ls -l, який дає вам розмір файлу.


10

кішка не працюватиме, якщо у назві файлів є пробіли. ось замість цього однокласичний Perl.

perl -nle 'chomp; $x+=(stat($_))[7]; END{print $x}' files.txt

8
python3 -c"import os; print(sum(os.path.getsize(f) for f in open('files.txt').read().split()))"

Або якщо ви просто хочете підсумовувати числа, вставте:

python3 -c"import sys; print(sum(int(x) for x in sys.stdin))"

1
... | python -c'import sys; print(sum(int(x) for x in sys.stdin))'коли пітон 2 зникає наприкінці цього року.
Однойменний

don @ oysters: ~ / Документи $ котячий податок | python3 -c "import sys; print (sum (int (x) for x in sys.stdin))" Traceback (останній виклик останній): Файл "<string>", рядок 1, в <module> Файл "<рядок > ", рядок 1, у <genexpr> ValueError: недійсний літерал для int () з базою 10: '\ n'
не яскраво


5

Цілий ls -l, а потім розрізаний досить вивертий, коли у вас є stat . Він також вразливий до точного формату ls -l (він не працював, поки я не змінив номери стовпців для вирізання )

Також зафіксовано марне використання кота .

<files.txt  xargs stat -c %s | paste -sd+ - | bc

2
Ага. Використовував Unix протягом 32 років, і ніколи не знав, що <infile commandце те саме, що (і в кращому порядку, ніж) command <infile.
Каміль Ґудесюн

5

якщо у вас не встановлено комп'ютер, спробуйте

echo $(( $(... | paste -sd+ -) ))

замість

... | paste -sd+ - | bc

$( ) <- повертає значення виконання команди

$(( 1+2 )) <- повернути оцінені результати

echo <- відлуння його на екран


4

Ви можете використовувати наступний сценарій, якщо ви просто хочете використовувати сценарій оболонки без awk або інших перекладачів:

#!/bin/bash

total=0

for number in `cat files.txt | xargs ls -l | cut -c 23-30`; do
   let total=$total+$number
done

echo $total

3

Я б використав "du" замість цього.

$ cat files.txt | xargs du -c | tail -1
4480    total

Якщо ви просто хочете номер:

cat files.txt | xargs du -c | tail -1 | awk '{print $1}'

5
Використання диска! = Розмір файлу. du повідомляє про використання диска.
0x6adb015

4
Я думаю, що перемикач -b змушує ду робити те, що мені потрібно.
RichieHindle

@ 0x6adb015 Хороші знання. Спасибі, я не зрозумів.
MichaelJones

3
Це корисна відповідь з конкретної причини, чому ОП хотіла додати стовпчик цифр, але для загального випадку додавання чисел він не відповідає. (Я весь час використовую "du", але я прийшов сюди шукати математику командного рядка. :-))
Michael H.

12
Це не вийде, коли files.txtвеликий. Якщо кількість аргументів в трубі xargsдосягає певного порогу, воно розбиває їх на кілька викликів до du. Загальна кількість, показана наприкінці, - це загальна сума лише для останнього дзвінка du, а не для всього списку.
Метью Сімоно


1

Труба в гоук:

 cat files.txt | xargs ls -l | cut -c 23-30 | gawk 'BEGIN { sum = 0 } // { sum = sum + $0 } END { print sum }'

1

Ось моя

cat files.txt | xargs ls -l | cut -c 23-30 | sed -e :a -e '$!N;s/\n/+/;ta' | bc

6
+1 за те, що раз і назавжди довести, що існують гірші мови, ніж perl :)
bdonlan

1
#
#       @(#) addup.sh 1.0 90/07/19
#
#       Copyright (C) <heh> SjB, 1990
#       Adds up a column (default=last) of numbers in a file.
#       95/05/16 updated to allow (999) negative style numbers.


case $1 in

-[0-9])

        COLUMN=`echo $1 | tr -d -`

        shift

;;

*)

        COLUMN="NF"

;;

esac

echo "Adding up column .. $COLUMN .. of file(s) .. $*"

nawk  ' OFMT="%.2f"                                       # 1 "%12.2f"

        { x = '$COLUMN'                                   # 2

          neg = index($x, "$")                            # 3

          if (neg > 0) X = gsub("\\$", "", $x)

          neg = index($x, ",")                            # 4

          if (neg > 1) X = gsub(",", "", $x)

          neg = index($x, "(")                            # 8 neg (123 & change

          if (neg > 0) X = gsub("\\(", "", $x)

          if (neg > 0) $x = (-1 * $x)                     # it to "-123.00"

          neg = index($x, "-")                            # 5

          if (neg > 1) $x = (-1 * $x)                     # 6

          t += $x                                         # 7

          print "x is <<<", $x+0, ">>> running balance:", t

        } ' $*


# 1.  set numeric format to eliminate rounding errors
# 1.1 had to reset numeric format from 12.2f to .2f 95/05/16
#     when a computed number is assigned to a variable ( $x = (-1 * $x) )
#     it causes $x to use the OFMT so -1.23 = "________-1.23" vs "-1.23"
#     and that causes my #5 (negative check) to not work correctly because
#     the index returns a number >1 and to the neg neg than becomes a positive
#     this only occurs if the number happened to b a "(" neg number
# 2.  find the field we want to add up (comes from the shell or defaults
#     to the last field "NF") in the file
# 3.  check for a dollar sign ($) in the number - if there get rid of it
#     so we may add it correctly - $12 $1$2 $1$2$ $$1$$2$$ all = 12
# 4.  check for a comma (,) in the number - if there get rid of it so we
#     may add it correctly - 1,2 12, 1,,2 1,,2,, all = 12   (,12=0)
# 5.  check for negative numbers
# 6.  if x is a negative number in the form 999- "make" it a recognized
#     number like -999 - if x is a negative number like -999 already
#     the test fails (y is not >1) and this "true" negative is not made
#     positive
# 7.  accumulate the total
# 8.  if x is a negative number in the form (999) "make it a recognized
#     number like -999
# * Note that a (-9) (neg neg number) returns a postive
# * Mite not work rite with all forms of all numbers using $-,+. etc. *

1

Мені подобається користуватися….

echo "
1
2
3 " | sed -e 's,$, + p,g' | dc 

вони покажуть суму кожного рядка ...

звернення за цією ситуацією:

ls -ld $(< file.txt) | awk '{print $5}' | sed -e 's,$, + p,g' | dc 

Усього - останнє значення ...


1
cat files.txt | awk '{ total += $1} END {print total}'

Ви можете використовувати awk, щоб зробити те саме, що навіть пропускає не цілі числа

$ cat files.txt
1
2.3
3.4
ew
1

$ cat files.txt | awk '{ total += $1} END {print total}'
7.7

або ви можете скористатися командою ls і обчислити читаний людиною вихід

$ ls -l | awk '{ sum += $5} END  {hum[1024^3]="Gb"; hum[1024^2]="Mb"; hum[1024]="Kb"; for (x=1024^3; x>=1024; x/=1024) { if (sum>=x) { printf "%.2f %s\n",sum/x,hum[x]; break; } } if (sum<1024) print "1kb"; }'
15.69 Mb

$ ls -l *.txt | awk '{ sum += $5} END  {hum[1024^3]="Gb"; hum[1024^2]="Mb"; hum[1024]="Kb"; for (x=1024^3; x>=1024; x/=1024) { if (sum>=x) { printf "%.2f %s\n",sum/x,hum[x]; break; } } if (sum<1024) print "1kb"; }'
2.10 Mb

Вам навіть не потрібна труба: awk '{ total += $1} END {print total}' files.txtшвидше
bmv

0

На мою думку, найпростішим рішенням для цього є команда "expr" unix:

s=0; 
for i in `cat files.txt | xargs ls -l | cut -c 23-30`
do
   s=`expr $s + $i`
done
echo $s


0
sizes=( $(cat files.txt | xargs ls -l | cut -c 23-30) )
total=$(( $(IFS="+"; echo "${sizes[*]}") ))

Або ви можете просто підсумувати їх, читаючи розміри

declare -i total=0
while read x; total+=x; done < <( cat files.txt | xargs ls -l | cut -c 23-30 )

Якщо вам не байдуже розміри прикусу та блоки, це просто

declare -i total=0
while read s junk; total+=s; done < <( cat files.txt | xargs ls -s )

0

Якщо у вас є R, ви можете використовувати:

> ... | Rscript -e 'print(sum(scan("stdin")));'
Read 4 items
[1] 2232320

Оскільки мені подобається R, у мене фактично є кілька псевдонімів для таких речей, щоб я міг їх використовувати, bashне пам'ятаючи цього синтаксису. Наприклад:

alias Rsum=$'Rscript -e \'print(sum(scan("stdin")));\''

що давайте мені робити

> ... | Rsum
Read 4 items
[1] 2232320

Натхнення: Чи є спосіб отримати мінімум, макс, медіану та середнє число списку чисел в одній команді?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.