Запитання з тегом «character-encoding»

Кодування символів відноситься до того, як символи представлені у вигляді ряду байтів. Кодування символів для Інтернету визначено в Стандарті кодування.

17
Чи є перевернутий характер каретки?
Мені доводиться підтримувати велику кількість класичних сторінок ASP, на багатьох з яких є табличні дані, у яких немає можливостей сортування. Що б ви не замовляли оригінальний розробник, який використовується в запиті до бази даних, це те, що ви застрягли. Я хочу застосувати деякі основні сортування на купу цих сторінок, і …

13
Як перетворити рядки в і з UTF8 байтових масивів на Java
У Java у мене є String, і я хочу кодувати його як байтовий масив (в UTF8 або іншому кодуванні). Крім того, у мене є байтовий масив (в якомусь відомому кодуванні), і я хочу його перетворити в рядок Java. Як зробити ці перетворення?

8
Запис тексту Unicode у текстовий файл?
Я витягаю дані з документа Google, обробляю їх і записую у файл (що врешті-решт я вставлю на сторінку Wordpress). Він містить деякі символи, що не належать до ASCII. Як можна безпечно перетворити ці символи в символи, які можна використовувати у джерелі HTML? В даний час я перетворюю все в Unicode …

18
Як ви повторюєте чотиризначний символ Unicode в Bash?
Я б хотів додати череп і перекладини Unicode до мого підказки для оболонки (зокрема, "СКУЛЬ І КРОСБОНИ" (U + 2620)), але я не можу розгадати магічну заклик зробити так, щоб ехо випльовувало його чи будь-яке інше, 4-значний символ Unicode. Двозначні цифри легко. Наприклад, echo -e "\ x55",. Окрім наведених нижче …


10
Що таке вертикальна вкладка?
Яким було оригінальне історичне використання символу вертикальної вкладки ( \vмовою C, ASCII 11)? У нього колись була клавіша на клавіатурі? Як хтось це генерував? Чи існує сьогодні якась мова чи система, де символ вертикальної вкладки робить щось цікаве та корисне?

10
"Для рядка в ..." призводить до UnicodeDecodeError: "utf-8" кодек не може розшифрувати байт
Ось мій код, for line in open('u.item'): #read each line щоразу, коли я запускаю цей код, він видає таку помилку: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte Я спробував це вирішити і додати додатковий параметр у open (), виглядає код; for line in open('u.item', …

6
Чому назви шаблонів не є константами?
Проблеми з гарнітурою самі по собі заплутані та складні, але крім того, ви повинні запам’ятати точні назви ваших карт. Це "utf8"? Або "utf-8"? А може "UTF-8"? Під час пошуку в Інтернеті зразків коду ви побачите все вищезазначене. Чому б просто не зробити їх названими константами і використовувати Charset.UTF8?

16
Мені дійсно потрібно кодувати "&" як "& amp;"
Я використовую &символ " " з HTML5 та UTF-8 у своїх сайтах <title>. Google показує розмір амперсанда та штраф на своїх SERP, як і всі браузери в їх назвах. http://validator.w3.org дає мені це: & не запустив посилання на персонаж. (І, мабуть, слід було б уникнути як &.) Мені справді потрібно …

12
PHP DOMDocument loadHTML неправильно кодує UTF-8
Я намагаюся проаналізувати деякий HTML за допомогою DOMDocument, але коли я це роблю, я раптом втрачаю кодування (принаймні так мені здається). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Результатом цього коду є те, що я отримую …

6
Чим відрізняється кодування / декодування?
Я ніколи не був впевнений, що розумію різницю між декодуванням str / unicode і кодуванням. Я знаю, що str().decode()це стосується того, що у вас є рядок байтів, який, на вашу думку, має певне кодування символів, враховуючи це ім'я кодування, воно поверне рядок unicode. Я знаю, що unicode().encode()перетворює символи unicode в …

11
Перетворити Unicode в ASCII без помилок у Python
Мій код просто скребкує веб-сторінку, а потім перетворює на Unicode. html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) Але я отримую UnicodeDecodeError : Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 2818: ordinal …

4
Чому слід вказати @charset “UTF-8”; у вашому CSS-файлі?
Я бачив цю інструкцію як найперший рядок із численних файлів CSS, які мені передали: @charset "UTF-8"; Що це робить, і чи потрібне це правило? Крім того, якщо я включу цей метатег у свій елемент "head", чи не усуне це необхідність його наявності у моїх CSS-файлах? <meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

11
Яка різниця між кодуванням та кодом?
Мене плутає кодування тексту та діаграма. З багатьох причин мені доводиться вивчати матеріали, що не належать до Unicode, не UTF8, у своїй майбутній роботі. Я знаходжу слово "charset" в заголовках електронної пошти, як в "ISO-2022-JP", але такого кодування в текстових редакторах немає. (Я оглянув різні текстові редактори.) Яка різниця між …

11
PHP: Перетворіть будь-який рядок в UTF-8, не знаючи оригінального набору символів, або принаймні спробуйте
У мене є програма, яка працює з клієнтами з усього світу, і, природно, я хочу, щоб все, що знаходиться в моїх базах даних, було закодовано UTF-8. Основна проблема для мене полягає в тому, що я не знаю, яким буде кодування джерела будь-якого рядка - це може бути з текстового поля …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.