Запитання з тегом «unicode»

Unicode - стандарт для кодування, подання та обробки тексту з метою підтримки всіх символів, необхідних для написаного тексту, що включає всі системи письма, технічні символи та пунктуацію.

6
Проблема кодування Java FileReader
Я намагався використовувати java.io.FileReader для читання деяких текстових файлів і перетворення їх у рядок, але я виявив, що результат неправильно закодований і зовсім не читабельний. Ось моє середовище: Windows 2003, кодування ОС: CP1252 Java 5.0 Мої файли мають закодований UTF-8 або CP1252, а деякі з них (файли, кодовані UTF-8) можуть …
130 java  file  unicode  encoding 

12
Перетворення символів, наголосних букв в англійський алфавіт
Проблема полягає в тому, що, як відомо, в діаграмі Unicode є тисячі символів, і я хочу перетворити всі подібні символи в літери, які є англійським алфавітом. Наприклад, ось кілька конверсій: ҥ->H Ѷ->V Ȳ->Y Ǭ->O Ƈ->C tђє Ŧค๓เℓy --> the Family ... і я побачив, що існує більше 20 версій букви …

7
Про що нормалізується UTF-8?
Проект ICU (який також тепер має бібліотеку PHP ) містить класи, необхідні для нормалізації рядків UTF-8, щоб полегшити порівняння значень під час пошуку. Однак я намагаюся розібратися, що це означає для додатків. Наприклад, у яких випадках я хочу "Канонічну еквівалентність" замість "Еквівалентність сумісності" чи навпаки?

8
Що таке код коду HTML 8203?
Що означає код символів (HTML) ​? Я знайшов це в одному зі своїх сценаріїв jQuery і задумався, що це таке .. Дякую. Редагувати: Ось сценарій, в якому він був (додали його до кінця, знайшли його у Firebug) <script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script> <script type="text/javascript"> var $jnyh = jQuery.noConflict(); $jnyh(function() { $jnyh("#title-nyh").click(function() { …


3
Unicode еквіваленти для \ w і \ b в регулярних виразах Java?
Багато сучасних реагеджезних інтерпретацій інтерпретують \wстенографію класу символів як "будь-яку букву, цифру або з'єднувальний розділовий знак" (зазвичай: підкреслення). Таким чином, регулярний вираз , як \w+сірники слова , як hello, élève, GOÄ_432або gefräßig. На жаль, Java ні. У Java \wобмежується [A-Za-z0-9_]. Це ускладнює узгодження слів, подібних до вищезгаданих, серед інших проблем. …

7
Python - "ascii" кодек не може розшифрувати байт
Я справді розгублений. Я намагався кодувати, але помилка сказала can't decode.... >>> "你好".encode("utf8") Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128) Я знаю, як уникнути помилки з префіксом "u" на рядку. Мені просто …

10
Як запобігти відображенню символів Unicode як емоджи в HTML із JavaScript?
Я знаходжу Unicode для спеціальних символів з пошуку FileFormat.Info . Деякі символи відображаються як класичні чорно-білі гліфи, наприклад ⚠ (попереджувальний знак \u26A0або ⚠). Вони є кращими, оскільки я можу застосувати до них стилі CSS (наприклад, кольорові). Інші візуалізують як новіші мультфільми смайлів, наприклад ⌛ (пісочний годинник \u231Bабо ⌛). Вони не …
119 javascript  html  css  unicode  emoji 

4
CSS: як додати пробіл перед вмістом елемента?
Жоден із наведених нижче кодів не працює: p:before { content: " "; } p:before { content: " "; } Як додати пробіл перед вмістом елемента? Примітка. Мені потрібно розфарбувати лівий кордон та край ліворуч для семантичного використання та використовувати простір як безбарвне поле. :)

13
Створення символу Unicode з його числа
Я хочу відобразити на Яві символ Unicode. Якщо я це роблю, це працює чудово: String symbol = "\u2202"; символ дорівнює "∂". Це те, що я хочу. Проблема полягає в тому, що я знаю номер Unicode і мені потрібно створити символ Unicode з цього. Я спробував (для мене) очевидне: int c …

6
Як я можу вивести UTF-8 з Perl?
Я намагаюся написати сценарій Perl за допомогою прагми "utf8", і я отримую несподівані результати. Я використовую Mac OS X 10.5 (Leopard), і я редагую TextMate. Усі мої налаштування як для мого редактора, так і для операційної системи за замовчуванням записують файли у форматі utf-8. Однак, коли я ввожу наступне у …
110 perl  unicode  utf-8 

3
Як працює UTF-8 "кодування змінної ширини"?
У стандарті unicode є достатня кількість кодових точок, що вам потрібно 4 байти, щоб зберігати їх усі. Ось що робить кодування UTF-32. Однак кодування UTF-8 якимось чином видавлює їх у набагато менші простори, використовуючи щось, що називається "кодування змінної ширини". Насправді йому вдається представити перші 127 символів US-ASCII лише в …

3
Які найпоширеніші символи Unicode, що не належать до BMP, фактично використовуються? [зачинено]
Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб він зосередив увагу на одній проблемі лише редагуючи цю публікацію . Закрито 6 років тому . Удосконаліть це питання З вашого досвіду, які символи Unicode, кодові точки, діапазони поза BMP …

5
Який правильний спосіб кодувати URL-символи Unicode?
Я знаю про нестандартну схему% uxxxx, але це не здається мудрим вибором, оскільки W3C цю схему було відхилено. Кілька цікавих прикладів: Характер серця. Якщо я введіть це у свій браузер: http://www.google.com/search?q=♥ Потім скопіюйте та вставте, я бачу цю URL-адресу http://www.google.com/search?q=%E2%99%A5 завдяки чому здається, що це робить Firefox (або Safari). urllib.quote_plus(x.encode("latin-1")) …


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.