Хтось надіслав мені текстовий файл. Хоча я можу прочитати більшу частину документа, іноді бувають незвичайні символи. Коли я відкриваю його у VIM, я бачу & lt; 92 & gt; в цьому місці. Коли я використовую gedit, я бачу символ, який виглядає як квадрат з двома нулями і 9 і 4 на квадраті.
Чи є спосіб розшифрувати ці забавні персонажі назад до їхнього читабельного еквівалента?
У оболонці також виконано таке:
johncomputer> file --mime-encoding file.txt
johncomputer> file.txt: : utf-8
Так що я думаю, що це utf8 закодований.
Ох, а також, це текстовий документ, де більшість символів можна прочитати. Лише деякі (не всі) акцентовані символи з'являються дивно.
‰PNG
на початку, відкрив файл jpeg ÿØÿà JFIF
на початку і т.д.
<92>
, це, безумовно, не UTF-8.