Запитання з тегом «character-encoding»

Кодування символів відноситься до того, як символи представлені у вигляді ряду байтів. Кодування символів для Інтернету визначено в Стандарті кодування.

6
Чи є код ASCII 7-бітним чи 8-розрядним?
Мій вчитель сказав мені, що ASCII - це 8-бітова схема кодування символів. Але він визначений лише для 0-127 кодів, що означає, що його можна помістити в 7-біт. Тож чи не можна стверджувати, що біт ASCII насправді є 7-бітовим кодом? І що ми взагалі маємо сказати, кажучи, що ASCII - це …

7
Як надійно вгадати кодування між MacRoman, CP1252, Latin1, UTF-8 та ASCII
На роботі здається, що жоден тиждень не проходить без конічності, катастрофи чи катастрофи. Проблема зазвичай виникає у програмістів, які думають, що вони можуть надійно обробити "текстовий" файл, не вказуючи кодування. Але ти не можеш. Тому було вирішено відтепер забороняти файлам мати імена, які закінчуються на *.txtабо *.text. Мислення полягає в …



3
Це "& # 160;" заміна "& nbsp;"?
У моїй програмі ASP.NET я намагався додати кілька пробілів між двома текстовими полями, набравши пробіл. Еквівалентне джерело HTML було  замість  . Тож я просто хотів перевірити: чи це нова заміна білого простору? Якщо так, будь-яка ідея, чому вони змінилися?

2
Скільки бітів чи байтів у символі? [зачинено]
Важко сказати, про що тут питають. Це питання неоднозначне, розпливчасте, неповне, надто широке або риторичне, і на нього не можна обґрунтовано відповісти у його нинішній формі. Щоб отримати допомогу щодо роз’яснення цього питання з метою його відновлення, відвідайте довідковий центр . Закрито 9 років тому . Скільки бітів або байтів …

10
Шарсе "все включено", щоб уникати "java.nio.charset.MalformedInputException: Вхідна довжина = 1"?
Я створюю просту програму підрахунку слів на Java, яка читає текстові файли каталогу. Однак я продовжую отримувати помилку: java.nio.charset.MalformedInputException: Input length = 1 з цього рядка коду: BufferedReader reader = Files.newBufferedReader(file,Charset.forName("UTF-8")); Я знаю, що, мабуть, отримую це, тому що використовував, Charsetякий не включав деякі символи в текстові файли, деякі з …

3
JsonParseException: Незаконні символи без котирувань ((CTRL-CHAR, код 10)
Я намагаюся використати org.apache.httpcomponentsRest API, який буде розміщувати дані формату JSON в API. Я отримую цей виняток: Викликано: com.fasterxml.jackson.core.JsonParseException: Незаконні символи без котирувань ((CTRL-CHAR, код 10)): потрібно уникнути, використовуючи зворотну риску, щоб включити в рядок. Причиною є те, що ctrl-charвключено до рядка JSON. Чи є спосіб замінити це чи якесь …

9
Читання CSV-файлу UTF8 за допомогою Python
Я намагаюся прочитати файл CSV із наголошеними символами за допомогою Python (лише французькі та / або іспанські символи). На основі документації Python 2.5 для csvreader ( http://docs.python.org/library/csv.html ) я придумав такий код для читання файлу CSV, оскільки csvreader підтримує лише ASCII. def unicode_csv_reader(unicode_csv_data, dialect=csv.excel, **kwargs): # csv.py doesn't do Unicode; …

6
Як знайти кодування / кодування за замовчуванням у Java?
Очевидна відповідь - використовувати, Charset.defaultCharset()але нещодавно ми з’ясували, що це може бути не вірною відповіддю. Мені сказали, що результат кілька разів відрізняється від справжньої кодировки за замовчуванням, яку кілька разів використовували класи java.io. Схоже, Java зберігає 2 набори символів за замовчуванням. Хто-небудь мав ідею щодо цього питання? Нам вдалося відтворити …

6
Проблеми з кодуванням виводу журналу git у командному рядку Windows 10
Проблема Як зробити, щоб git logвихід команди правильно відображався в командному рядку Windows? Приклад Як бачите, я можу вводити діакритичні символи належним чином, але на git logвиході якимось чином уникнуто. Відповідно до UTF-8таблиці кодування коди між кутовими дужками ( <і >) з виводу відповідають раніше введеним git configпараметрам. Я намагався …

5
Python: Перетворення з ISO-8859-1 / latin1 на UTF-8
У мене є цей рядок, який розшифровано з Quoted-printable до ISO-8859-1 за допомогою модуля електронної пошти. Це дає мені такі рядки, як "\ xC4pple", які відповідали б "Äpple" (Apple шведською). Однак я не можу перетворити ці рядки на UTF-8. >>> apple = "\xC4pple" >>> apple '\xc4pple' >>> apple.encode("UTF-8") Traceback (most …

13
Збережіть усі файли у проекті Visual Studio як UTF-8
Цікаво, чи можливо зберегти всі файли у проекті Visual Studio 2008 у певному кодуванні символів. Я отримав рішення зі змішаними кодуваннями і хочу зробити їх однаковими (UTF-8 з підписом). Я знаю, як зберегти окремі файли, але як щодо всіх файлів у проекті?

7
Перетворення байтового масиву в String (Java)
Я пишу веб-програму в Google App Engine. Це дозволяє людям в основному редагувати html-код, який зберігається як .htmlфайл у магазині. Я використовую fetchData, щоб повернути a byte[]усіх символів у файлі. Я намагаюся надрукувати на html, щоб користувач міг редагувати html-код. Все працює чудово! Ось моя єдина проблема зараз: Байтовий масив …

4
Чи існує набір файлів “Lorem ipsums” для тестування питань кодування символів?
Для компонування маємо наш відомий текст "Lorem ipsum", щоб перевірити, як він виглядає. Я шукаю набір файлів, що містять Текст, закодований декількома різними кодуваннями, які я можу використовувати у своїх тестах JUnit для тестування деяких методів, що мають справу з кодуванням символів під час читання текстових файлів. Приклад: Наявність ISO …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.