Запитання з тегом «unicode»

Unicode - галузевий стандарт обчислювальної техніки для послідовного кодування, представлення та обробки тексту, вираженого в більшості світових систем письма.



2
Як я можу встановити кодування за замовчуванням для VIM на UTF-8?
Я хотів би внести свій внесок у проект із відкритим кодом, що забезпечує перекладені рядки. Однією з їхніх вимог є те, що дописувачі повинні використовувати UTF-8 як кодування для файлів PO. Я використовую VIM 7.3 в Linux. Як я можу бути впевненим, що для кодування VIM встановлено UTF-8, щоб я …

2
Чому printf “скорочується” умулат?
Якщо я виконую такий простий скрипт: #!/bin/bash printf "%-20s %s\n" "Früchte und Gemüse" "foo" printf "%-20s %s\n" "Milchprodukte" "bar" printf "%-20s %s\n" "12345678901234567890" "baz" Він друкує: Früchte und Gemüse foo Milchprodukte bar 12345678901234567890 baz тобто текст з umlauts (наприклад, ü) "стискається" на один символ на umlaut. Звичайно, я маю десь …
54 bash  unicode  printf 

6
Фільтрування недійсного utf8
У мене є текстовий файл у невідомому або змішаному кодуванні. Я хочу побачити рядки, що містять послідовність байтів, що не є дійсним UTF-8 (шляхом передачі текстового файлу в якусь програму). Рівно, я хочу відфільтрувати рядки, які є дійсними UTF-8. Іншими словами, я шукаю .grep [notutf8] Ідеальне рішення було б портативним, …

2
Які шрифти корисні для гліфів Unicode
Тож я переглянув цю відповідь на stackoverflow і зрозумів, що мої шрифти не охоплюють всієї серії спектру унікоду utf-8 (оскільки я отримую багато квадратів). Хтось знає шрифт, який покриє всю цю посаду?
38 fonts  unicode 

1
Чи слід використовувати UTF-8 символів типу ⏰ у скрипті bash / shell?
Простий код тут працює, як очікувалося, на моїй машині, якщо його запустити bash: function ⏰(){ date } ⏰ Чи може бути проблема інших людей, які використовують це, чи це універсально? Мені цікаво, тому що я ніколи не бачив нічого подібного в іншому вихідному коді. Редагувати: Існує необмежена кількість можливостей, за …
36 bash  shell  unicode 

1
Як довести до відома не-ascii (unicode) символів?
Я намагаюся видалити деякі символи з файлу (UTF-8). Я використовую trдля цієї мети: tr -cs '[[:alpha:][:space:]]' ' ' <testdata.dat Файл містить деякі іноземні символи (наприклад, "Латвійська" або "àé"). trСхоже, їх не розуміє: він трактує їх як не-альфа і видаляє теж. Я спробував змінити деякі мої параметри локалі: LC_CTYPE=C LC_COLLATE=C tr …


5
Оновив мій сервер арки Linux і тепер я отримую tmux: потрібен локальний UTF-8 (LC_CTYPE), але мати ANSI_X3.4-1968
Нещодавно я оновив свій сервер Arch Linux і під час цього процесу tmux отримав оновлення. Я використовував tmuxпід час оновлення і використовував його згодом, але все під час того ж сеансу SSH. Однак тепер, коли я намагаюся задати будь-яку tmuxкоманду, я отримую цю помилку: tmux: need UTF-8 locale (LC_CTYPE) but …

4
Як вказати символи за допомогою шістнадцяткових кодів у `grep`?
Це питання було переміщено із переповнення стека, оскільки на нього можна відповісти на Unix & Linux Stack Exchange. Мігрували 8 років тому . Я використовую наступну команду для позначення діапазону набору символів для шістнадцяткового коду 0900 (замість अ) до 097F (замість व). Як я можу використовувати шістнадцятковий код замість अ …

3
Чому сорт каже, що ɛ = e?
ɛ("Латинська epsilon") - літера, яка використовується в певних африканських мовах, як правило, для позначення голосного звуку в англійській мові "bed". У Unicode він закодований як U + 025B, дуже відмінний від повсякденного e. Однак, якщо я sortнаступне: eb ed ɛa ɛc здається, що sortвважає ɛі eрівнозначним: ɛa eb ɛc ed …
25 sort  locale  unicode 

6
Як кажучи, як я можу перетворити Unicode Codepoint [0-9A-F] в символ для друку?
У мене є список кодових точок Unicode, але я не знаю про "простий" спосіб перетворення цих шестигранних значень у фактичні символи, які вони представляють ... Я чув, що zsh має echo -e '\u0965', але я використовую bash 4.1. Чи є щось таке просте, як метод zsh, для bash?
23 bash  unicode 

6
Перетворення між формами нормалізації Unicode у командному рядку unix
У Unicode деякі комбінації символів мають більше одного представлення. Наприклад, символ ä може бути представлений як "ä", тобто кодова точка U + 00E4 (два байти c3 a4в кодуванні UTF-8), або як "ä", тобто дві кодові точки U + 0061 U + 0308 (три байти 61 cc 88в UTF-8). Згідно стандарту …


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.