Запитання з тегом «unicode»

Unicode - стандарт для кодування, подання та обробки тексту з метою підтримки всіх символів, необхідних для написаного тексту, що включає всі системи письма, технічні символи та пунктуацію.

9
Помилка "неправильного значення рядка" MySQL при збереженні рядка Unicode в Django
Я отримав дивне повідомлення про помилку, коли намагався зберегти ім’я, прізвище до моделі auth_user Django. Невдалі приклади user = User.object.create_user(username, email, password) user.first_name = u'Rytis' user.last_name = u'Slatkevičius' user.save() >>> Incorrect string value: '\xC4\x8Dius' for column 'last_name' at row 104 user.first_name = u'Валерий' user.last_name = u'Богданов' user.save() >>> Incorrect string …
158 python  mysql  django  unicode  utf-8 

3
Python: Використання .format () у рядку, уникнутому Unicode
Я використовую Python 2.6.5. Мій код вимагає використання знака "більше або рівний". Ось це іде: >>> s = u'\u2265' >>> print s >>> ≥ >>> print "{0}".format(s) Traceback (most recent call last): File "<input>", line 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode character u'\u2265' in position 0: ordinal not …

6
u '\ ufeff' у рядку Python
Я отримую помилку із наступним малюнком: UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128) Не впевнений, що u'\ufeff'це таке, він з’являється, коли я перебираю веб-сторінки. Як можна виправити ситуацію? Метод .replace()рядків не працює на ньому.
153 python  unicode  utf-8 

7
Що таке "сурогатна пара" на Java?
Я читав документацію для StringBuffer, зокрема, методу зворотного () . У цій документації щось згадується про сурогатних пар . Що таке сурогатна пара в цьому контексті? А що таке низькі та високі сурогати?


13
Python, Unicode та консоль Windows
На цей питання є відповіді на Stack Overflow на російському : Як з Python вивести на Windows-консоль строку в Юнікоде? Коли я намагаюся надрукувати рядок Unicode на консолі Windows, я отримую UnicodeEncodeError: 'charmap' codec can't encode character ....помилку. Я припускаю, що це тому, що консоль Windows не приймає символи, призначені …
146 python  unicode 

2
Яка різниця між символом, кодовою точкою, гліфом та графемою?
Намагаючись зрозуміти тонкощі сучасного Unicode, мені болить голова. Зокрема, відмінність між кодовими точками, символами, гліфами та графемами - поняттями, які, у найпростішому випадку, при роботі з англійським текстом, використовуючи символи ASCII, усі мають взаємозв'язок один з одним - викликають у мене неприємності. Бачачи, як ці терміни використовуються в таких документах, …

8
Чому довжина цього рядка більше, ніж кількість символів у ньому?
Цей код: string a = "abc"; string b = "A𠈓C"; Console.WriteLine("Length a = {0}", a.Length); Console.WriteLine("Length b = {0}", b.Length); Виходи: Length a = 3 Length b = 4 Чому? Єдине, що я міг собі уявити, - це те, що китайський символ має 2 байти і .Lengthметод повертає кількість байтів.

10
Рядок Python друкується як [u'String ']
На цей питання є відповіді на Stack Overflow на російському : за кодировками utf-8 видано результат за різним натисканням Це, безумовно, буде легким, але це насправді клопоче мене. У мене є сценарій, який читається на веб-сторінці і використовує Beautiful Soup для його розбору. З супу я витягую всі посилання, оскільки …
142 python  unicode  ascii 

8
Чи можу я змусити git розпізнавати файл UTF-16 як текст?
Я відстежую файл віртуальної машини Virtual PC (* .vmc) в git, і після внесення зміни git визначив файл як бінарний і не став би для нього відмінним. Я виявив, що файл закодований в UTF-16. Чи можна навчити Git розпізнавати, що цей файл - текст та обробляти його належним чином? Я …

6
Чому Python друкує символи unicode, коли кодування за замовчуванням - ASCII?
З оболонки Python 2.6: >>> import sys >>> print sys.getdefaultencoding() ascii >>> print u'\xe9' é >>> Я очікував, що після заяви про друк з'явиться або помилка, або помилка, оскільки символ "é" не є частиною ASCII, і я не вказав кодування. Я думаю, я не розумію, що означає кодування ASCII за …

5
Різниця між UTF-8 і UTF-16?
Різниця між UTF-8 і UTF-16? Навіщо нам це потрібно? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest = md.digest();
137 java  unicode  utf-8  utf-16  utf 

4
NameError: глобальне ім'я 'unicode' не визначено - в Python 3
Я намагаюся використовувати пакет Python під назвою bidi. У модулі цього пакета (algormm.py) є деякі рядки, які дають мені помилку, хоча це є частиною пакету. Ось рядки: # utf-8 ? we need unicode if isinstance(unicode_or_str, unicode): text = unicode_or_str decoded = False else: text = unicode_or_str.decode(encoding) decoded = True і …

7
Unicode символи в URL-адресах
Чи пропонували б Ви в 2010 році URL-адреси, що містять символи UTF-8, на великому веб-порталі? Символи Unicode заборонені згідно з RFC у URL-адресах (див. Тут ). Вони повинні бути відсотково закодовані, щоб відповідати стандартам. Моя головна думка, однак, полягає в обслуговуванні некодованих символів з єдиною метою мати красиві URL-адреси, тому …
135 html  url  unicode  utf-8 

3
Вставте Unicode символ у JavaScript
Мені потрібно вставити Omega (Ω) на мою сторінку html. Для цього я використовую код, що уникнув HTML, і я можу написати Ωта отримати Ω. Це все добре і добре, коли я вкладаю його в HTML-елемент; однак, коли я намагаюся вкласти його у свій JS, наприклад var Omega = Ω, він …
134 javascript  html  unicode 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.