Чеські символи змінилися на тарабарство


-1

У мене є така дивна проблема з Windows 10 Home Edition. Коли я відкриваю базовий текстовий файл, .srt або .txt наприклад, він має інше кодування. Я вважаю, що це через різне кодування, оскільки я чеська

ε, č,,,,,, ň, ň, ň і так далі,

це означає Unicode, Windows-1250 або ISO Latin 2.

Я намагався змінити мову ОС - не допоміг.
Переглядаючи параметри в Chrome, теж було марно - у мене немає проблем під час перегляду. Завантаження текстових файлів з IE, Opera або Firefox принесло ті ж результати.
Я завантажую їх вручну з сайту, присвяченого суббідування фільмів і серій.

  • Коли я завантажував текстовий файл на інший комп'ютер, чеські символи були прекрасні.
  • Надсилання завантаженого файлу через пошту Facebook
  • або перенесення його за допомогою флеш-диска змінило чеський символ у бруду.
    Наприклад, "файл" був збережений у файлі як "?", "Č" був "і", і т.д.

2
Windows не може вгадати кодування текстового файлу, оскільки ця інформація не зберігається у файлі, тому вона повинна використовувати поточну кодову сторінку. Краще використовувати Notepad ++ і вибрати кодування вручну і перетворити в Unicode. Якщо у вас є MS Word, він може досить ефективно вгадати кодування
phuclv

Відповіді:


0

Windows 10, на відміну від більш ранніх версій Windows, не має значних можливостей підтримки мови.

Необхідно отримати індивідуальні мовні пакети з панелі керування мовами.

Подивитися https://support.microsoft.com/help/14236/language-packs деталі щодо кожного джерела мови.


Я вже завантажив пакет чеської мови і встановив її за замовчуванням, але проблема все ще зберігається. У цій ситуації я абсолютно не знаю.
Alorain

@Alorain ви також повинні змінити до чеської мови або Windows буде використовувати типову кодову сторінку
phuclv

0

Якщо він відображає неправильний символ, то він або не UTF-8, але його інтерпретують як UTF-8 або UTF-8, але він не відображає його як uni-код.

Unicode призначає унікальну точку коду всім символам, якщо у вас є кодування UTF-8, і це призводить до кодової точки, для якої у мене немає гліфу, тоді мій вікно 10 відображає цей гліф missingglyph Якщо кодова точка не є дійсною, відображається вікно 10 Unknown.

Оскільки ви отримуєте неправильні символи, а не невідомі - я думаю, що кодування не правильно інтерпретується. Тому я вважаю, що всі файли UTF-8 і обидві машини розглядають файли як UTF-8.

UTF-8 є кодуванням Unicode, однак Windows-1250 або ISO Latin 2 - кодові сторінки, які інтерпретують ті ж самі байтові послідовності, що і різні символи.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.