Запитання з тегом «byte-order-mark»

Знак порядку байтів (BOM) - це символ Unicode, який використовується для сигналізації порядку байтів у текстовому файлі або потоці. Оскільки специфікацією є U + FEFF, це дає зрозуміти, чи є байти високого порядку першими (потік починає FE.FF) або другим (потік починає FF.FE).



4
Запишіть у файл UTF-8 на Python
Я справді плутаю з codecs.open function. Коли я роблю: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Це дає мені помилку UnicodeDecodeError: кодек "ascii" не може декодувати байт 0xef в положенні 0: порядковий не знаходиться в діапазоні (128) Якщо я: file = open("temp", "w") file.write(codecs.BOM_UTF8) file.close() Це чудово працює. Питання : …

30
Як я можу вивести CSV UTF-8 в PHP, щоб Excel правильно прочитав?
У мене дуже проста річ, яка просто виводить деякі речі у форматі CSV, але це має бути UTF-8. Я відкриваю цей файл у TextEdit або TextMate або Dreamweaver, і він відображає UTF-8 символів належним чином, але якщо я відкрию його в Excel, він робить це безглуздо. Ось що я маю …

10
UTF-8 без BOM
У мене є файли javascript, які мені потрібні для збереження в UTF-8 (без BOM), кожен раз, коли я конвертую їх у потрібний формат у Блокноті ++ , вони повертаються назад до UTF-8 з BOM, коли я відкриваю їх у Visual Studio. Як я можу зупинити VS2010 від цього? Інше питання, …

22
Як видалити ï »¿з початку файлу?
У мене є CSS-файл, який добре виглядає, коли я відкриваю його за допомогою gedit , але коли він читається PHP (щоб об'єднати всі CSS-файли в один), цей CSS має такі символи: PHP видаляє все пробіли, тому випадковий ï »¿посеред коду псує всю справу. Як я вже згадував, я не можу …

9
Пишіть текстові файли без позначки порядку в байтах (BOM)?
Я намагаюся створити текстовий файл за допомогою VB.Net з кодуванням UTF8, без BOM. Хтось може мені допомогти, як це зробити? Я можу писати файл із кодуванням UTF8, але як видалити з нього марку порядку замовлення? edit1: я спробував такий код; Dim utf8 As New UTF8Encoding() Dim utf8EmitBOM As New UTF8Encoding(True) …

8
Позначка порядку байтів прикручує читання файлів на Java
Я намагаюся читати файли CSV за допомогою Java. Деякі з файлів можуть мати позначку порядку байтів на початку, але не всі. Якщо присутній, порядок байт читається разом з рештою першого рядка, тим самим виникаючи проблеми зі порівнянням рядків. Чи є простий спосіб пропустити позначку порядку байту, коли він присутній? Дякую!

5
Використовуючи awk для видалення позначки порядку байт
Як би awk виглядав сценарій (імовірно, однолінійний) для видалення BOM ? Специфікація: надрукувати кожен рядок після першого (NR > 1 ) для першого рядка: якщо він починається з #FE #FFабо #FF #FE, видаліть їх та надрукуйте решту

4
Встановіть для кодування файлу значення UTF8 зі специфікацією у піднесеному тексті 3
Коли я відкриваю файл у Sublime Text 3, внизу у мене є можливість встановити кодування символів, як показано на скріншоті. Існує можливість встановити його на UTF-8 , що після проведення деяких досліджень означає UTF-8 без специфікації, але я хочу встановити його на UTF-8 із специфікацією, як показано нижче: Як я …

6
Перетворити UTF-8 із специфікацією на UTF-8 без специфікації на Python
Два запитання тут. У мене є набір файлів, які зазвичай є UTF-8 із специфікацією. Я хотів би перетворити їх (в ідеалі на місці) на UTF-8 без специфікації. Здається codecs.StreamRecoder(stream, encode, decode, Reader, Writer, errors), впорався б із цим. Але я насправді не бачу хороших прикладів використання. Чи був би це …

8
Як виявити кодування символів текстового файлу?
Я намагаюся виявити, яке кодування символів використовується у моєму файлі. Я намагаюся за допомогою цього коду отримати стандартне кодування public static Encoding GetFileEncoding(string srcFile) { // *** Use Default of Encoding.Default (Ansi CodePage) Encoding enc = Encoding.Default; // *** Detect byte order mark if any - otherwise assume default byte[] …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.