Відповіді:
Окрім правильної відповіді fedorqui , я хотів би показати різницю між довжиною рядка та довжиною байтів:
myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
LANG=$oLang LC_ALL=$oLcAll
printf "%s is %d char len, but %d bytes len.\n" "${myvar}" $chrlen $bytlen
винесе:
Généralités is 11 char len, but 14 bytes len.
Ви навіть можете подивитися збережені символи:
myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
printf -v myreal "%q" "$myvar"
LANG=$oLang LC_ALL=$oLcAll
printf "%s has %d chars, %d bytes: (%s).\n" "${myvar}" $chrlen $bytlen "$myreal"
відповість:
Généralités has 11 chars, 14 bytes: ($'G\303\251n\303\251ralit\303\251s').
Нота: Відповідно до коментаря Ізабелл Коуан , я додав налаштування $LC_ALL
разом із $LANG
.
Аргумент працює так само, як і звичайні змінні
strLen() {
local bytlen sreal oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#1}
printf -v sreal %q "$1"
LANG=$oLang LC_ALL=$oLcAll
printf "String '%s' is %d bytes, but %d chars len: %s.\n" "$1" $bytlen ${#1} "$sreal"
}
буде працювати як
strLen théorème
String 'théorème' is 10 bytes, but 8 chars len: $'th\303\251or\303\250me'
printf
інструмент корекції:Якщо ви:
for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do
printf " - %-14s is %2d char length\n" "'$string'" ${#string}
done
- 'Généralités' is 11 char length
- 'Language' is 8 char length
- 'Théorème' is 8 char length
- 'Février' is 7 char length
- 'Left: ←' is 7 char length
- 'Yin Yang ☯' is 10 char length
Не дуже гарне ... Для цього є маленька функція:
strU8DiffLen () {
local bytlen oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#1}
LANG=$oLang LC_ALL=$oLcAll
return $(( bytlen - ${#1} ))
}
Тоді тепер:
for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do
strU8DiffLen "$string"
printf " - %-$((14+$?))s is %2d chars length, but uses %2d bytes\n" \
"'$string'" ${#string} $((${#string}+$?))
done
- 'Généralités' is 11 chars length, but uses 14 bytes
- 'Language' is 8 chars length, but uses 8 bytes
- 'Théorème' is 8 chars length, but uses 10 bytes
- 'Février' is 7 chars length, but uses 8 bytes
- 'Left: ←' is 7 chars length, but uses 9 bytes
- 'Yin Yang ☯' is 10 chars length, but uses 12 bytes
Але залишилися такі дивні поведінки UTF-8, як подвійні інтервали, нульові інтервали, зворотне зміщення та інші, які не можуть бути такими простими ...
Подивіться на diffU8test.sh або diffU8test.sh.txt, щоб отримати додаткові обмеження.
Щоб отримати довжину рядка, що зберігається у змінній, скажіть:
myvar="some string"
size=${#myvar}
Щоб підтвердити правильність збереження, echo
це:
$ echo "$size"
11
$rulename
починається з $RULE_PREFIX
префікса: [ "${rulename:0:${#RULE_PREFIX}}" == "$RULE_PREFIX" ]
#myvar
та {#myvar}
?
${#parameter}
: довжина символів розширеного значення параметра замінена .
Ви можете використовувати:
MYSTRING="abc123"
MYLENGTH=$(printf "%s" "$MYSTRING" | wc -c)
wc -c
або wc --bytes
для кількості байтів = символи Unicode рахуються з 2, 3 або більше байтами.wc -m
або wc --chars
для підрахунку символів = символи Unicode вважаються одиничними, поки вони не використовують більше байтів.mylen=$(printf "%s" "$HOME/.ssh" | wc -c)
як прийняте рішення не вдається, і вам потрібно myvar=$HOME/.ssh
спершу.
Я хотів найпростіший випадок, нарешті це результат:
echo -n 'Tell me the length of this sentence.' | wc -m;
36
echo '' | wc -m
=> 1
. Вам потрібно буде використовувати -n
: echo -n '' | wc -m
=> 0
... в такому випадку це вдале рішення :)
-n do not output the trailing newline
Якщо ви хочете використовувати це з аргументами командного рядка або функції, переконайтеся, що ви використовуєте size=${#1}
замість size=${#$1}
. Другий може бути більш інстинктивним, але це неправильний синтаксис.
size=${#1}
безумовно, діє.
#
не замінює $
- $
зовнішні дужки все ще є оператором розширення. Оператор #
довжини, як завжди.
У відповідь на початок публікації:
Якщо ви хочете використовувати це з аргументами командного рядка або функції ...
з кодом:
size=${#1}
Може виникнути випадок, коли ви просто хочете перевірити наявність аргументу нульової довжини і не потрібно зберігати змінну. Я вважаю, ви можете використовувати такий синтаксис:
if [ -z "$1" ]; then
#zero length argument
else
#non-zero length
fi
Дивіться GNU та wooledge для більш повного переліку умовних виразів Bash.
Використовуючи наданий приклад
#KISS (Keep it simple stupid)
size=${#myvar}
echo $size
Ось кілька способів розрахунку довжини змінної:
echo ${#VAR}
echo -n $VAR | wc -m
echo -n $VAR | wc -c
printf $VAR | wc -m
expr length $VAR
expr $VAR : '.*'
а для встановлення результату в іншій змінній просто призначте вищезгадану команду із зворотною цитатою в іншу змінну наступним чином:
otherVar=`echo -n $VAR | wc -m`
echo $otherVar
http://techopsbook.blogspot.in/2017/09/how-to-find-length-of-string-variable.html