Запитання з тегом «unicode»

Unicode - стандарт для кодування, подання та обробки тексту з метою підтримки всіх символів, необхідних для написаного тексту, що включає всі системи письма, технічні символи та пунктуацію.

16
UnicodeDecodeError: кодек "ascii" не може декодувати байт 0xef у позиції 1
У мене є кілька проблем, які намагаються кодувати рядок до UTF-8. Я спробував численні речі, включаючи використання string.encode('utf-8')і unicode(string), але я отримую помилку: UnicodeDecodeError: кодек "ascii" не може декодувати байт 0xef у положенні 1: порядковий не знаходиться в діапазоні (128) Це мій рядок: (。・ω・。)ノ Я не бачу, що йде не …
106 python  unicode  utf-8 

3
Як я можу виконати чутливу до культури операцію "починаючи з" із середини рядка?
У мене є вимога , яке є відносно неясним, але він відчуває , як це повинно бути можливо з допомогою BCL. Для контексту я аналізую рядок дати / часу в Noda Time . Я підтримую логічний курсор для свого положення у вхідному рядку. Таким чином, хоча повна рядок може бути …
106 .net  string  unicode 

4
Як я можу повторити через кодові точки unicode Java-рядка?
Тож я знаю про String#codePointAt(int), але він індексується charзміщенням, а не зміщенням кодової точки. Я думаю про спробувати щось на кшталт: використовуючи String#charAt(int)для отримання charіндексу тестування, чи charзнаходиться в діапазоні високих сурогатів якщо так, використовуйте String#codePointAt(int)для отримання кодової точки та збільшення індексу на 2 якщо ні, використовуйте задане charзначення як …
105 java  string  unicode 

5
Використовуючи awk для видалення позначки порядку байт
Як би awk виглядав сценарій (імовірно, однолінійний) для видалення BOM ? Специфікація: надрукувати кожен рядок після першого (NR > 1 ) для першого рядка: якщо він починається з #FE #FFабо #FF #FE, видаліть їх та надрукуйте решту

11
Як змусити інтерпретатора python правильно обробляти символи, що не належать до ASCII, в операціях рядків?
У мене є рядок, який виглядає так: 6Â 918Â 417Â 712 Очевидний спосіб вирізання цієї рядки (як я розумію Python) - це просто сказати, що рядок знаходиться в змінній, що називається s, ми отримуємо: s.replace('Â ', '') Це повинно зробити трюк. Але, звичайно, він скаржиться, що не ASCII-символ '\xc2'у файлі …
104 python  unicode 

9
Помилка кодування Python Unicode
Я читаю і аналізую XML-файл Amazon, і, хоча файл XML показує ", при спробі його надрукувати я отримую таку помилку: 'ascii' codec can't encode character u'\u2019' in position 16: ordinal not in range(128) З того, що я читав в Інтернеті до цих пір, помилка випливає з того, що XML-файл знаходиться …
104 python  unicode  ascii  encode 

12
Довжина рядка в байтах у JavaScript
У своєму коді JavaScript мені потрібно скласти повідомлення серверу в такому форматі: <size in bytes>CRLF <data>CRLF Приклад: 3 foo Дані можуть містити символи unicode. Мені потрібно надіслати їх як UTF-8. Я шукаю найбільш крос-браузерний спосіб обчислити довжину рядка в байтах у JavaScript. Я спробував це, щоб скласти мій корисний вантаж: …

5
Як поставити символ Unicode в XAML?
Я намагаюся це зробити: <TextBlock Text="{Binding Path=Text, Converter={StaticResource stringFormatConverter}, ConverterParameter='&\u2014{0}'}" /> To get a - з’явитися перед текстом. Це не працює. Що мені тут робити?
104 wpf  xaml  unicode  binding 

8
Читання персонажа з файлу в Python
У текстовому файлі є рядок "Мені це не подобається". Однак, коли я читаю його в рядок, він стає "я не \ xe2 \ x80 \ x98t подібний". Я розумію, що \ u2018 - це представлення унікоду "" ". я використовую f1 = open (file1, "r") text = f1.read() команда виконати …

5
Чому Apache Commons вважає числом "१२३"?
Згідно з документацією Apache Commons Lang для StringUtils.isNumeric()рядка "१२३" є числовим. Оскільки я вважав, що це може бути помилкою в документації, я провів тести, щоб перевірити твердження. Я виявив, що згідно з Apache Commons він є числовим. Чому цей рядок числовий? Що представляють ці персонажі?

6
Будь-які проблеми, що використовують unicode_literals в Python 2.6?
Ми вже отримали нашу базу коду, що працює під Python 2.6. Щоб підготуватися до Python 3.0, ми почали додавати: з __future__ імпортуйте unicode_literals у наші .pyфайли (у міру їх зміни). Мені цікаво, чи хтось інший це робив, і натрапив на будь-які не очевидні хатчі (можливо, витративши багато часу на налагодження).

4
Python str та unicode типів
Працюючи з Python 2.7, мені цікаво, яка реальна перевага є у використанні типу unicodeзамість str, оскільки обидва вони, здається, можуть утримувати рядки Unicode. Чи є якась особлива причина, окрім того, що не можна встановлювати коди Unicode в unicodeрядках, використовуючи табличку втечі \?: Виконання модуля за допомогою: # -*- coding: utf-8 …
101 python  string  unicode 

4
Як використовувати грецькі символи в ggplot2?
Мої категорії потрібно назвати грецькими літерами. Я використовую ggplot2, і це прекрасно працює з даними. На жаль, я не можу зрозуміти, як розмістити ці грецькі символи на осі х (біля галочок), а також зробити так, щоб вони відображалися в легенді. Чи можна це зробити? ОНОВЛЕННЯ: Я переглянув посилання , проте …
101 r  graphics  unicode  utf-8  ggplot2 

7
Як я можу видалити символи, що не належать до ASCII, але залишити періоди та пробіли за допомогою Python?
Я працюю з файлом .txt. Я хочу, щоб рядок тексту з файла не містив символів, що не належать до ASCII. Однак я хочу залишити пробіли та періоди. В даний час я їх також знімаю. Ось код: def onlyascii(char): if ord(char) < 48 or ord(char) > 127: return '' else: return …
100 python  text  unicode  filter  ascii 

3
UnicodeDecodeError під час перенаправлення у файл
Я запускаю цей фрагмент двічі в терміналі Ubuntu (кодування встановлено на utf-8), один раз з, ./test.pyа потім за допомогою ./test.py >out.txt: uni = u"\u001A\u0BC3\u1451\U0001D10C" print uni Без перенаправлення він друкує сміття. З перенаправленням я отримую UnicodeDecodeError. Чи може хтось пояснити, чому я отримую помилку лише у другому випадку, а ще …
100 python  unicode 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.