У Блокноті ++ кодування файлу встановлено на UTF-8, але кодування насправді ASCII


0

Мені потрібні деякі текстові файли, які потрібно закодувати як текстові файли UTF-8, коли я використовую їх із Notepad ++. Однак іноді у мене кодування UTF-8 вибрано як кодування в Notepad ++, але файл насправді знаходиться в ASCII. Я знаю це двома різними методами.

Перший метод полягає в тому, що я використовую простий вікі-движок під назвою Mobiki на XAMPP, який відображатиме лише правильні символи, закодовані UTF-8. Мій текстовий файл не відображається правильно з Mobiki. Другий метод, який я використовував для перевірки, реалізує веб- сторінку http://www.checkfiletype.com . Коли я завантажую файли проблем на цю сторінку, веб-сайт повідомляє мені, що файл закодований у форматі ASCII. Інші сторінки, які працюють з Mobiki, кодуються у форматі UTF-8 після повернення веб-сайту.

Чому Notepad ++ не примушує цей файл бути файлом UTF-8 та / або як змусити Notepad ++ зробити це? Я спробував вибрати "Перетворити в UTF-8", навіть незважаючи на те, що "Блокнот ++" показує, що файл вже закодований в UTF-8, але форсування цього перетворення не допомогло.

Я знайшов кілька інших публікацій на форумі, які описують подібну проблему, але їх вирішення полягало лише у створенні нового текстового файлу. Я сподіваюся знайти рішення без створення нового текстового файлу.


Спасибі за інформацію. Так, для цього файлу Notepad ++ відображається UTF-8 у правому нижньому куті, але це, здається, неправильно. У файлі є проблеми з моєю вікі, і веб-сайт checkfiletype.com показує, що це ASCII. Тому, можливо, це помилка, як ви вказали, можливо.
azim58


Чи можливо, що файл, кодований як UTF-8, має "BOM" (позначка порядку байтів), закодований у перших трьох байтах? Ця BOM є безглуздою для UTF-8, оскільки лише UCS-2 / UTF-16 / UCS-4 дбає про порядок байтів. Але деякі редактори зловживають цим як позначення кодування UTF.
Зан Лінкс

Відповіді:


1

Файли, що містять лише символи ASCII, представлені однаково в кодуваннях ASCII та UTF-8. Ніякої різниці між цими двома, якщо файл не містить хоча б одного символу, що не належить до ASCII.

Що б не викликало вашу проблему, це не кодування.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.