Запитання з тегом «character-encoding»

Питання, що стосуються різних зображень символів та наборів символів, таких як: ASCII, UTF-8, EBCDIC, серед інших. Часто виникає при переміщенні файлів між операційними системами, що кодують нові рядки з поверненнями каретки та / або символами нового рядка.

2
Як я можу встановити кодування за замовчуванням для VIM на UTF-8?
Я хотів би внести свій внесок у проект із відкритим кодом, що забезпечує перекладені рядки. Однією з їхніх вимог є те, що дописувачі повинні використовувати UTF-8 як кодування для файлів PO. Я використовую VIM 7.3 в Linux. Як я можу бути впевненим, що для кодування VIM встановлено UTF-8, щоб я …

6
Фільтрування недійсного utf8
У мене є текстовий файл у невідомому або змішаному кодуванні. Я хочу побачити рядки, що містять послідовність байтів, що не є дійсним UTF-8 (шляхом передачі текстового файлу в якусь програму). Рівно, я хочу відфільтрувати рядки, які є дійсними UTF-8. Іншими словами, я шукаю .grep [notutf8] Ідеальне рішення було б портативним, …

4
Як називається ^ М символ?
TexPad створює його. Я знаю, що це під якимось глухим ключем. Я просто не можу згадати це ім'я. Синій символ: Я просто хочу масово видалити їх із свого документа. Як ви можете це ввести?

3
Як я можу перевірити кодування текстового файлу ... Чи дійсно це та що це?
У мене є кілька .htmфайлів, які відкриваються в Gedit без будь-якого попередження / помилки, але коли я відкриваю ці самі файли Jedit, він попереджає мене про недійсне кодування UTF-8 ... Мета-тег HTML зазначає "charset = ISO-8859-1". Jedit дозволяє Список запасних кодувань та Список кодуючих автодетекторів (на даний момент "BOM XML-PI"), …

4
відлуння байтів у файл
Я намагаюся підключити свій rasberry Pi до якогось дисплея за допомогою шини i2c. Для початку я хотів вручну написати речі, зокрема байти у файл. Як ви пишете конкретні байти у файл? Я вже читав це і вважав, що мою проблему слід вирішити приблизно так echo -n -e \x66\x6f\x6f > byteFileForNow …

3
Яке кодування шаблонів використовується для назви файлів та шляхів у Linux?
Це залежить від того, яку файлову систему я використовую? Наприклад, ext2 / ext3 / ext4, але і що трапляється, коли я вставляю один із цих "joliet" CD-ROM з ISO 9660? Я чув, що POSIX містить якусь специфікацію для кодування шаблонів імен файлів? По суті, мені цікаво, якщо я отримав закодоване …

2
find (1): як реалізовано підстановку зірки, щоб вона не змогла отримати деякі назви файлів?
У файловій системі, де назви файлів є в UTF-8, у мене є файл із несправним іменем; вона відображається як:, D�sinstallerфактична назва відповідно до zsh:, D$'\351'sinstallerLatin1 for Désinstaller, сама по собі французьке варварство для "видалення". Zsh не погодився б з цим, [[ $file =~ '^.*$' ]]але зіставлю його з глобусом *- …

4
Як вказати символи за допомогою шістнадцяткових кодів у `grep`?
Це питання було переміщено із переповнення стека, оскільки на нього можна відповісти на Unix & Linux Stack Exchange. Мігрували 8 років тому . Я використовую наступну команду для позначення діапазону набору символів для шістнадцяткового коду 0900 (замість अ) до 097F (замість व). Як я можу використовувати шістнадцятковий код замість अ …

5
Чому деякі символи відображаються як квадрати в Chrome?
Наприклад, у інструментах для розробників я отримую щось на кшталт: Деякі з цих квадратів знаходяться в кінці рядків, спочатку я думав, що вони повертаються до вагона, але виявляється, що це не так. Крім того, квадрати з’являються після =або >в багатьох місцях, де немає нового рядка, а перегляд файлу в шістнадцятковому …

3
Розуміння кодування імені файлу Unix
Мені важко зрозуміти, як працює кодування імені файлів. На unix.SE я знаходжу суперечливі пояснення. Імена файлів зберігаються як символи Напрошу ще одну відповідь: Кілька питань щодо кодування символів файлової системи на Linux […] Як ви згадуєте у своєму запитанні, ім'я файлу UNIX - це лише послідовність символів; ядро нічого не …

2
tr скаржиться на "Незаконні послідовності байтів"
Я абсолютно новий для UNIX, і я використовую "Кінговий рядок Mac OS X" Кірка МакЛехрена, щоб навчити себе деяким командам. Я намагаюся використовувати trі grepтак , що я можу шукати текстові рядки в регулярній MS-Office Word Document. $ tr '\r' '\n' < target-file | grep search-string Але все, що повертається: …

4
ідентифікуйте файли з символами, що не належать до ASCII, або у файлі, що не друкуються
У каталозі розміром 80 ГБ з приблизно 700 000 файлів є деякі імена файлів з неанглійськими символами у назві файлу. Окрім того, що копітко перебирається через список файлів, є: Простий спосіб перелічити або іншим чином визначити ці імена файлів? Спосіб генерації символів, які можна друкувати не англійською мовою - ті …


5
Перетворення файлу UTF-8 в ASCII (найкращі зусилля)
У мене є файл в UTF-8, який містить тексти на декількох мовах. Дуже багато це імена людей. Мені потрібно конвертувати його в ASCII, і мені потрібен результат, щоб він виглядав максимально пристойно. Існує багато способів підходу до перетворення від ширшого кодування до більш вузького. Найпростішим перетворенням було б замінити всі …

6
Створення випадкового пароля; чому це не портативний?
Я хочу створити випадковий пароль, і роблю це так: </dev/urandom tr -dc [:print:] | head -c 64 На моєму ноутбуці, на якому працює Ubuntu, це створює лише друковані символи, як було призначено. Але коли я заходжу на сервер своєї школи, який запускає Red Hat Enterprise Linux, і запускаю його там, …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.