Виходячи з відповіді garyjohn, ось однолінійний, який також форматує висновок, зрозумілий для людини:
find . -type f -print0 | xargs -0 ls -l | awk '{ n=int(log($5)/log(2)); if (n<10) { n=10; } size[n]++ } END { for (i in size) printf("%d %d\n", 2^i, size[i]) }' | sort -n | awk 'function human(x) { x[1]/=1024; if (x[1]>=1024) { x[2]++; human(x) } } { a[1]=$1; a[2]=0; human(a); printf("%3d%s: %6d\n", a[1],substr("kMGTEPYZ",a[2]+1,1),$2) }'
Ось розгорнута його версія:
find . -type f -print0 \
| xargs -0 ls -l \
| awk '{ n=int(log($5)/log(2)); \
if (n<10) n=10; \
size[n]++ } \
END { for (i in size) printf("%d %d\n", 2^i, size[i]) }' \
| sort -n \
| awk 'function human(x) { x[1]/=1024; \
if (x[1]>=1024) { x[2]++; \
human(x) } } \
{ a[1]=$1; \
a[2]=0; \
human(a); \
printf("%3d%s: %6d\n", a[1],substr("kMGTEPYZ",a[2]+1,1),$2) }'
У першому awk
я визначив мінімальний розмір файлу, щоб зібрати всі файли менше 1 кб в одне місце. По-друге awk
, human(x)
визначена функція для створення читабельного для людини розміру. Ця частина заснована на одній з відповідей тут: /unix/44040/a-standard-tool-to-convert-a-byte-count-into-human-kib-mib-etc -подобний-дю-лс1
Вихід вибірки виглядає так:
1k: 335
2k: 16
32k: 5
128k: 22
1M: 54
2M: 11
4M: 13
8M: 3