Запитання з тегом «utf-8»

UTF-8 - це кодування символів, яке описує кожну точку коду Unicode, використовуючи послідовність байтів від одного до чотирьох байтів. Він сумісний з ASCII назад, але при цьому підтримує представлення всіх кодів коду Unicode.

5
Який правильний спосіб кодувати URL-символи Unicode?
Я знаю про нестандартну схему% uxxxx, але це не здається мудрим вибором, оскільки W3C цю схему було відхилено. Кілька цікавих прикладів: Характер серця. Якщо я введіть це у свій браузер: http://www.google.com/search?q=♥ Потім скопіюйте та вставте, я бачу цю URL-адресу http://www.google.com/search?q=%E2%99%A5 завдяки чому здається, що це робить Firefox (або Safari). urllib.quote_plus(x.encode("latin-1")) …

10
UnicodeDecodeError: кодек "ascii" не може декодувати байт 0xd1 у позиції 2: порядковий не знаходиться в діапазоні (128)
Я намагаюся працювати з дуже великим набором даних, у якому є деякі нестандартні символи. Мені потрібно використовувати Unicode відповідно до специфікацій роботи, але я збита з пантелику. (І цілком можливо, це все роблять неправильно.) Я відкриваю CSV за допомогою: 15 ncesReader = csv.reader(open('geocoded_output.csv', 'rb'), delimiter='\t', quotechar='"') Потім я намагаюся кодувати …
107 python  django  utf-8 

16
UnicodeDecodeError: кодек "ascii" не може декодувати байт 0xef у позиції 1
У мене є кілька проблем, які намагаються кодувати рядок до UTF-8. Я спробував численні речі, включаючи використання string.encode('utf-8')і unicode(string), але я отримую помилку: UnicodeDecodeError: кодек "ascii" не може декодувати байт 0xef у положенні 1: порядковий не знаходиться в діапазоні (128) Це мій рядок: (。・ω・。)ノ Я не бачу, що йде не …
106 python  unicode  utf-8 

9
Використання atob Javascript для декодування base64 неправильно декодує рядки utf-8
Я використовую функцію Javascript, window.atob()щоб розшифрувати кодовану рядок base64 (зокрема базовий вміст, кодований base64 з API GitHub). Проблема в тому, що я повертаю кодовані ASCII символи назад (як â¢замість ™). Як я можу правильно обробляти вхідний потік, кодований base64, щоб він був розшифрований як utf-8?

2
Змінення вихідного кодування PowerShell за замовчуванням на UTF-8
За замовчуванням, коли ви перенаправляєте висновок команди у файл або передаєте його в щось інше в PowerShell, кодування має значення UTF-16, що не є корисним. Я хочу змінити його на UTF-8. Це можна зробити в кожному конкретному випадку, замінивши >foo.txtсинтаксис на, | out-file foo.txt -encoding utf8але це незручно повторювати щоразу. …

8
C # Перетворити рядок з UTF-8 в ISO-8859-1 (Latin1) H
Я погукав на цю тему і переглянув кожну відповідь, але все ще не розумію. В основному мені потрібно перетворити рядок UTF-8 в ISO-8859-1, і я це роблю, використовуючи наступний код: Encoding iso = Encoding.GetEncoding("ISO-8859-1"); Encoding utf8 = Encoding.UTF8; string msg = iso.GetString(utf8.GetBytes(Message)); Мій рядок - це джерело Message = "ÄäÖöÕõÜü" …
103 c#  .net  encoding  utf-8  iso-8859-1 

14
Як правильно MySQL обробляти UTF-8
Один із відповідей на запитання, яке я задав учора, запропонував мені переконатися, що моя база даних може правильно обробляти символи UTF-8. Як я можу це зробити за допомогою MySQL?
102 mysql  utf-8 

4
Як використовувати грецькі символи в ggplot2?
Мої категорії потрібно назвати грецькими літерами. Я використовую ggplot2, і це прекрасно працює з даними. На жаль, я не можу зрозуміти, як розмістити ці грецькі символи на осі х (біля галочок), а також зробити так, щоб вони відображалися в легенді. Чи можна це зробити? ОНОВЛЕННЯ: Я переглянув посилання , проте …
101 r  graphics  unicode  utf-8  ggplot2 

6
Використання StringWriter для серіалізації XML
Зараз я шукаю простий спосіб серіалізації об’єктів (у C # 3). Я погуглив кілька прикладів і придумав щось на зразок: MemoryStream memoryStream = new MemoryStream ( ); XmlSerializer xs = new XmlSerializer ( typeof ( MyObject) ); XmlTextWriter xmlTextWriter = new XmlTextWriter ( memoryStream, Encoding.UTF8 ); xs.Serialize ( xmlTextWriter, myObject); …

7
Як декодувати захисні послідовності Unicode, такі як “\ u00ed”, до відповідних закодованих символів UTF-8?
Чи є в PHP функція, яка може декодувати послідовності екранування Unicode, як " \u00ed" до " í" та всі інші подібні випадки? Я знайшов подібне запитання тут, але, схоже, не працює.


3
Читання InputStream як UTF-8
Я намагаюся читати з text/plainфайлу через Інтернет, підряд за рядком. Зараз у мене код: URL url = new URL("http://kuehldesign.net/test.txt"); BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream())); LinkedList<String> lines = new LinkedList(); String readLine; while ((readLine = in.readLine()) != null) { lines.add(readLine); } for (String line : lines) { out.println("> " + …

5
Приклад недійсного рядка utf8?
Я перевіряю, як деякі мої коди обробляють неправильні дані, і мені потрібно кілька серій байтів, які є недійсними UTF-8. Чи можете ви опублікувати, а в ідеалі - пояснення, чому вони погані / де ви їх взяли?

11
Елегантний спосіб пошуку файлів UTF-8 за допомогою BOM?
Для налагодження мені потрібно рекурсивно шукати в каталозі всі файли, які починаються з позначки порядку байтів UTF-8 (BOM). Моє поточне рішення - простий скрипт оболонки: find -type f | while read file do if [ "`head -c 3 -- "$file"`" == $'\xef\xbb\xbf' ] then echo "found BOM in: $file" fi …
94 php  utf-8  shell  text-editor 

9
Читання CSV-файлу UTF8 за допомогою Python
Я намагаюся прочитати файл CSV із наголошеними символами за допомогою Python (лише французькі та / або іспанські символи). На основі документації Python 2.5 для csvreader ( http://docs.python.org/library/csv.html ) я придумав такий код для читання файлу CSV, оскільки csvreader підтримує лише ASCII. def unicode_csv_reader(unicode_csv_data, dialect=csv.excel, **kwargs): # csv.py doesn't do Unicode; …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.