Запитання з тегом «character-encoding»

Кодування символів відноситься до того, як символи представлені у вигляді ряду байтів. Кодування символів для Інтернету визначено в Стандарті кодування.


3
Як видалити символи, що не містять UTF-8, із текстового файлу
У мене є купа арабських, англійських, російських файлів, кодованих в utf-8. Намагаючись обробити ці файли за допомогою сценарію Perl, я отримую таку помилку: Malformed UTF-8 character (fatal) Перевіряючи вміст цих файлів вручну, я виявив у них дивних символів. Зараз я шукаю спосіб автоматичного видалення цих символів із файлів. Чи можна …

8
Програмування на C: Як програмувати для Unicode?
Які передумови необхідні для жорсткого програмування Unicode? Чи означає це, що мій код не повинен використовувати charтипи ніде, і що потрібно використовувати функції, які можуть мати справу з wint_tі wchar_t? І яку роль у цьому сценарії відіграють багатобайтові послідовності символів?

3
Java: Перетворення рядка в і з ByteBuffer та пов'язані з ним проблеми
Я використовую Java NIO для своїх сокетних з'єднань, і мій протокол базується на тексті, тому мені потрібно мати можливість перетворити рядки в ByteBuffers перед тим, як записати їх у SocketChannel, і перетворити вхідні ByteBuffers назад у рядки. В даний час я використовую цей код: public static Charset charset = Charset.forName("UTF-8"); …

1
Декодування Python Unicode не підтримується
У мене проблема з кодуванням у Python. Я пробував різні методи, але, здається, не можу знайти найкращого способу кодування свого виводу в UTF-8. Це те, що я намагаюся зробити: result = unicode(google.searchGoogle(param), "utf-8").encode("utf-8") searchGoogleповертає перший результат Google для param. Це помилка, яку я отримую: exceptions.TypeError: decoding Unicode is not supported …

21
Висновок PHP, що показує маленькі чорні діаманти зі знаком питання
Я пишу PHP-програму, яка бере з джерела бази даних. Деякі з варчарів мають цитати, які відображаються у вигляді чорних діамантів із знаком запитання ( , ЗАМІННИЙ ХАРАКТЕР , я припускаю з тексту Microsoft Word). Як я можу використовувати php для вилучення цих символів?

2
.NET Core не знає про Windows 1252, як це виправити?
Ця програма чудово працює при компіляції для .NET 4, але не працює при компіляції для .NET Core. Я розумію, що помилка щодо кодування не підтримується, але не в тому, як її виправити. Public Class Program Public Shared Function Main(ByVal args As String()) As Integer System.Text.Encoding.GetEncoding(1252) End Function End Class

18
Кодування FPDF utf-8 (ЯК ДО)
Хтось знає, як встановити кодування в пакеті FPDF на utf-8? Або принаймні до ISO-8859-7 (грецька), що підтримує грецькі символи? В основному я хочу створити pdf-файл, що містить грецькі символи. Будь-які пропозиції допомогли б. Джордж

3
Яка максимальна кількість байтів для кодованого символу UTF-8?
Яка максимальна кількість байтів для одного кодованого символу UTF-8? Я буду шифрувати байти рядка, закодованого в UTF-8, і тому мені потрібно мати можливість визначити максимальну кількість байтів для кодованого рядка UTF-8. Хтось може підтвердити максимальну кількість байтів для одного кодованого символу UTF-8, будь ласка

5
Проблеми з символами UTF-8; те, що я бачу, це не те, що я зберігав
Я спробував використати UTF-8 і зіткнувся з неприємностями. Я спробував стільки речей; ось результати, які я отримав: ????замість азіатських символів. Навіть за європейський текст, я взяв Se?orза Señor. Дивні халепи (Моджібаке?), Такі як Señorабо 新浪新闻для 新浪新闻. Чорні діаманти, такі як Сеор. Нарешті, я потрапив у ситуацію, коли дані були втрачені …

8
Як виявити кодування символів текстового файлу?
Я намагаюся виявити, яке кодування символів використовується у моєму файлі. Я намагаюся за допомогою цього коду отримати стандартне кодування public static Encoding GetFileEncoding(string srcFile) { // *** Use Default of Encoding.Default (Ansi CodePage) Encoding enc = Encoding.Default; // *** Detect byte order mark if any - otherwise assume default byte[] …

10
UTF8 до / з широкого перетворення символів у STL
Чи можна перетворити рядок UTF8 у std :: string у std :: wstring і навпаки незалежно від платформи? У програмі Windows я б використовував MultiByteToWideChar та WideCharToMultiByte. Однак код складений для декількох ОС, і я обмежуюсь стандартною бібліотекою C ++.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.