Запитання з тегом «ascii»

Схема кодування символів на основі впорядкування англійського алфавіту. ASCII розшифровується як американський стандартний код обміну інформацією.

9
(grep) Regex, щоб відповідати символам, що не належать до ASCII?
В Linux у мене каталог з великою кількістю файлів. Деякі з них мають символи, що не належать до ASCII, але всі вони є дійсними UTF-8 . Одна програма має помилку, яка заважає їй працювати з іменами, що не належать до ASCII, і я маю з’ясувати, на скільки це впливає. Я …
169 regex  unicode  grep  ascii 



10
Яка ідея ^ = 32, яка перетворює малі літери на верхні і назад?
Я вирішував якусь проблему на кодових силах. Зазвичай я спочатку перевіряю, чи є символ верхній або нижній англійською літерою, а потім віднімаю або додаю, 32щоб перетворити його у відповідну букву. Але я знайшов когось ^= 32зробити те саме. Ось: char foo = 'a'; foo ^= 32; char bar = 'A'; …

10
Рядок Python друкується як [u'String ']
На цей питання є відповіді на Stack Overflow на російському : за кодировками utf-8 видано результат за різним натисканням Це, безумовно, буде легким, але це насправді клопоче мене. У мене є сценарій, який читається на веб-сторінці і використовує Beautiful Soup для його розбору. З супу я витягую всі посилання, оскільки …
142 python  unicode  ascii 

6
Чому Python друкує символи unicode, коли кодування за замовчуванням - ASCII?
З оболонки Python 2.6: >>> import sys >>> print sys.getdefaultencoding() ascii >>> print u'\xe9' é >>> Я очікував, що після заяви про друк з'явиться або помилка, або помилка, оскільки символ "é" не є частиною ASCII, і я не вказав кодування. Я думаю, я не розумію, що означає кодування ASCII за …

5
Перетворення int в ASCII і назад в Python
Я працюю над створенням скорочувача URL-адрес для свого сайту, і мій поточний план (я відкритий для пропозицій) - використовувати ідентифікатор вузла для створення скороченої URL-адреси. Отже, теоретично, вузол 26 може бути short.com/z, вузол 1 може бути short.com/a, вузол 52 може бути short.com/Z, а вузол 104 може бути short.com/ZZ. Коли користувач …
137 python  integer  ascii  encode 



12
Попередження про "неможливий символ для кодування" на Java
Зараз я працюю над проектом Java, який видає таке попередження під час компіляції: /src/com/myco/apps/AppDBCore.java:439: warning: unmappable character for encoding UTF8 [javac] String copyright = "� 2003-2008 My Company. All rights reserved."; Я не впевнений, як SO відобразить символ перед датою, але це має бути символом авторського права і відображається в …
112 java  encoding  utf-8  ascii 


15
Як отримати значення ASCII рядка в C #
Я хочу отримати значення символів ASCII в рядку на C #. Якщо мій рядок має значення "9quali52ty3", я хочу масив зі значеннями ASCII кожного з 11 символів. Як я можу отримати значення ASCII в C #?
108 c#  encoding  ascii 

9
Помилка кодування Python Unicode
Я читаю і аналізую XML-файл Amazon, і, хоча файл XML показує ", при спробі його надрукувати я отримую таку помилку: 'ascii' codec can't encode character u'\u2019' in position 16: ordinal not in range(128) З того, що я читав в Інтернеті до цих пір, помилка випливає з того, що XML-файл знаходиться …
104 python  unicode  ascii  encode 

8
Читання персонажа з файлу в Python
У текстовому файлі є рядок "Мені це не подобається". Однак, коли я читаю його в рядок, він стає "я не \ xe2 \ x80 \ x98t подібний". Я розумію, що \ u2018 - це представлення унікоду "" ". я використовую f1 = open (file1, "r") text = f1.read() команда виконати …

7
Як я можу видалити символи, що не належать до ASCII, але залишити періоди та пробіли за допомогою Python?
Я працюю з файлом .txt. Я хочу, щоб рядок тексту з файла не містив символів, що не належать до ASCII. Однак я хочу залишити пробіли та періоди. В даний час я їх також знімаю. Ось код: def onlyascii(char): if ord(char) < 48 or ord(char) > 127: return '' else: return …
100 python  text  unicode  filter  ascii 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.