Запитання з тегом «unicode»

Unicode - стандарт для кодування, подання та обробки тексту з метою підтримки всіх символів, необхідних для написаного тексту, що включає всі системи письма, технічні символи та пунктуацію.

17
Найкращий спосіб конвертувати текстові файли між наборами символів?
Який найшвидший, найпростіший інструмент або спосіб перетворення текстових файлів між наборами символів? Зокрема, мені потрібно перетворити з UTF-8 на ISO-8859-15 і навпаки. Все йде: однолінійки улюбленої мови сценаріїв, інструменти командного рядка або інші утиліти для ОС, веб-сайтів тощо. Найкращі рішення поки що: У Linux / UNIX / OS X / …

8
Який найкращий спосіб видалити наголоси в рядку Unicode Python?
У мене в Python є рядок Unicode, і я хотів би видалити всі наголоси (діакритики). Я знайшов в Інтернеті елегантний спосіб зробити це на Java: перетворити рядок Unicode у його довгу нормовану форму (з окремим символом для літер та діакритики) видаліть усі символи, тип Unicode - "діакритичний". Чи потрібно мені …



12
UTF-8, UTF-16 та UTF-32
Які відмінності між UTF-8, UTF-16 та UTF-32? Я розумію, що всі вони зберігатимуть Unicode, і що кожен використовує різну кількість байтів для представлення символу. Чи є перевага у виборі одного над іншим?
486 unicode  utf-8  utf-16  utf  utf-32 

12
Збереження текстів utf-8 у json.dumps як UTF8, а не як послідовність переходу \ u
зразок коду: >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print json_string "\u05d1\u05e8\u05d9 \u05e6\u05e7\u05dc\u05d4" Проблема: це не читабельно для людини. Мої (розумні) користувачі хочуть перевірити або навіть редагувати текстові файли за допомогою відвалів JSON (і я краще не використовую XML). Чи є спосіб серіалізувати об'єкти в рядки UTF-8 JSON …
473 python  json  unicode  utf-8  escaping 

30
Найкращий спосіб повернути рядок
Я просто повинен був написати функцію зворотного рядка в C # 2.0 (тобто LINQ недоступний) і придумав це: public string Reverse(string text) { char[] cArray = text.ToCharArray(); string reverse = String.Empty; for (int i = cArray.Length - 1; i > -1; i--) { reverse += cArray[i]; } return reverse; } …

18
UnicodeDecodeError під час читання CSV-файлу в Pandas з Python
Я запускаю програму, яка обробляє 30 000 подібних файлів. Випадкове їх число зупиняється і видає цю помилку ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, in …

9
Яка різниця між ASCII та Unicode?
Яка точна різниця між Unicode та ASCII? ASCII має загалом 128 символів (256 у розширеному наборі). Чи є специфікація розміру для символів Unicode?
407 unicode  ascii 

9
Що таке Unicode, UTF-8, UTF-16?
Що є основою для Unicode і чому необхідність UTF-8 або UTF-16? Я досліджував це в Google і шукав і тут, але мені це не зрозуміло. У VSS під час порівняння файлів іноді виникає повідомлення про те, що два файли мають різні UTF. Чому це було б так? Будь ласка, поясніть …

5
Чому 2+ 40 дорівнює 42?
Мене було збентежено, коли колега показав мені цей рядок тривоги JavaScript 42. alert(2+ 40); Виконати фрагмент кодуСховати результатиРозгорніть фрагмент Швидко виявляється, що те, що схоже на знак мінус, насправді є прихованим символом Unicode з чітко різною семантикою. Це змусило мене замислитися, чому цей символ не створює синтаксичної помилки, коли вираз …

11
Як я переглядаю всі символи, що не належать до ASCII?
У мене є кілька дуже великих XML-файлів, і я намагаюся знайти рядки, що містять символи, що не належать до ASCII. Я спробував таке: grep -e "[\x{00FF}-\x{FFFF}]" file.xml Але це повертає кожен рядок у файлі, незалежно від того, чи містить рядок символ у вказаному діапазоні. У мене синтаксис неправильний чи я …
359 regex  unix  unicode  grep 


6
Як знайти довжину рядка в R
Як знайти довжину рядка (кількість символів у рядку), не розділяючи її на R? Я знаю, як знайти довжину списку, але не рядок. А як щодо рядків Unicode? Як знайти довжину (у байтах) та кількість символів (руни, символи) у рядку Unicode? Питання, пов'язані з цим: Як знайти "реальну" кількість символів у …


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.