Запитання з тегом «unicode»

Unicode - стандарт для кодування, подання та обробки тексту з метою підтримки всіх символів, необхідних для написаного тексту, що включає всі системи письма, технічні символи та пунктуацію.

12
Представлення каталогу та структури файлів у синтаксисі Markdown
Я хочу описати структури каталогів і файлів у деяких своїх публікаціях блогу Джекілла, чи Markdown пропонує акуратний спосіб вивести таке? Наприклад, ви можете побачити за цим посиланням на веб-сайті Jekyll, що каталог та структура файлів виводиться на сторінку дуже акуратно: . ├── _config.yml ├── _drafts │ ├── begin-with-the-crazy-ideas.textile │ └── …
215 unicode  markdown  jekyll 

6
Python __str__ проти __unicode__
Чи існує умова python для того, коли слід реалізувати __str__()проти __unicode__(). Я бачив заняття, які переосмислюють __unicode__()частіше, __str__()але, схоже, це не є послідовним. Чи є конкретні правила, коли краще реалізувати одне проти іншого? Чи потрібно / хороша практика для впровадження обох?

16
Як перевірити, чи є рядок в Python в ASCII?
Я хочу перевірити, чи є рядок в ASCII чи ні. Я знаю ord(), але коли я намагаюся ord('é'), я маю TypeError: ord() expected a character, but string of length 2 found. Я зрозумів, що це викликано тим, як я побудував Python (як це пояснено в ord()російській документації ). Чи є …
211 python  string  unicode  ascii 

7
Що таке "з'єднувальні символи" в ідентифікаторах Java?
Я читаю за SCJP, і у мене є питання щодо цього рядка: Ідентифікатори повинні починатися з літери, символу валюти ($) або сполучного символу, такого як підкреслення (_). Ідентифікатори не можуть починатися з числа! У ньому йдеться про те, що дійсне ім'я ідентифікатора може починатися із сполучного символу, такого як підкреслення. …
208 java  unicode  identifier  scjp 

16
Як перетворити wstring в рядок?
Питання в тому, як перетворити wstring в рядок? Маю наступний приклад: #include <string> #include <iostream> int main() { std::wstring ws = L"Hello"; std::string s( ws.begin(), ws.end() ); //std::cout <<"std::string = "<<s<<std::endl; std::wcout<<"std::wstring = "<<ws<<std::endl; std::cout <<"std::string = "<<s<<std::endl; } вихід із коментованим рядком: std::string = Hello std::wstring = Hello std::string …
204 c++  unicode  stl  wstring 

9
Як перетворити рядок у utf-8 в Python
У мене є браузер, який надсилає utf-8 символів на мій сервер Python, але коли я отримую його з рядка запиту, кодування, яке повертає Python, це ASCII. Як я можу перетворити просту рядок у utf-8? ПРИМІТКА: Рядок, переданий з Інтернету, вже закодований UTF-8, я просто хочу зробити так, щоб Python розглядав …

5
Чи існує символ символу гліфів Unicode для відображення "Пошук" [закрито]
Закрито . Це питання ґрунтується на думці . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб на нього можна було відповісти фактами та цитатами, відредагувавши цю публікацію . Закрито 4 роки тому . Удосконаліть це питання У Unicode є мільйон іконоподібних гліфів, але їх дуже важко шукати. …

5
Наскільки добре підтримується Unicode в C ++ 11?
Я читав і чув, що C ++ 11 підтримує Unicode. Кілька питань з цього приводу: Наскільки добре стандартна бібліотека C ++ підтримує Unicode? Робить std::stringте, що повинно? Як я ним користуюся? Де можливі проблеми?
183 c++  unicode  c++11 

6
Чим відрізняється кодування / декодування?
Я ніколи не був впевнений, що розумію різницю між декодуванням str / unicode і кодуванням. Я знаю, що str().decode()це стосується того, що у вас є рядок байтів, який, на вашу думку, має певне кодування символів, враховуючи це ім'я кодування, воно поверне рядок unicode. Я знаю, що unicode().encode()перетворює символи unicode в …

11
Перетворити Unicode в ASCII без помилок у Python
Мій код просто скребкує веб-сторінку, а потім перетворює на Unicode. html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) Але я отримую UnicodeDecodeError : Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 2818: ordinal …


9
(grep) Regex, щоб відповідати символам, що не належать до ASCII?
В Linux у мене каталог з великою кількістю файлів. Деякі з них мають символи, що не належать до ASCII, але всі вони є дійсними UTF-8 . Одна програма має помилку, яка заважає їй працювати з іменами, що не належать до ASCII, і я маю з’ясувати, на скільки це впливає. Я …
169 regex  unicode  grep  ascii 


9
Бетонний Jage Regex для наголошених персонажів (діакритики)
Я дивився на переповнення стека ( замінюючи символи .. е , як JavaScript не відповідає стандарту Unicode щодо RegExp тощо) і не знайшов конкретної відповіді на питання: How can JavaScript match for accented characters (those with diacritical marks)? Я змушую поле в інтерфейсі відповідати формату: last_name, first_name (останній [пробіл комами] …

8
Символ Unicode в рядку PHP
Це питання виглядає бентежно просто, але я не змогла знайти відповідь. Який PHP еквівалентний наступному рядку коду C #? string str = "\u1000"; Цей зразок створює рядок з єдиним символом Unicode, числове числове значення Unicode - 1000 у шістнадцятковій цифрі (4096 у десятковій частині). Тобто в PHP, як я можу …
164 php  unicode 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.