Я маю справу з файлом, який містить багато невидимих символів управління, як-от "праворуч ліворуч" або "нульова ширина неприєднувача", інші пробіли, ніж звичайний простір тощо, і у мене виникають проблеми з цим.
Тепер я хотів би якось переглядати всі букви в заданому файлі, буква за буквою (я хотів би сказати "зліва направо", але я, на жаль, маю справу з мовою справа наліво) , як кодові точки unicode, використовуючи лише основні інструменти Баш (як vi
, less
, cat
...). Чи можливо якось?
Я знаю, що можу відобразити файл у шістнадцятковій формі hexdump
, але мені доведеться перерахувати кодові точки. Мені дуже хочеться побачити фактичні кодові точки Unicode, щоб я міг їх погуглювати і дізнатися, що відбувається.
редагувати: Я додам, що я не хочу перекодувати його в інше кодування (тому що це я знаходжу в Інтернеті). У мене є файл в UTF8, і це добре. Я просто хочу знати точні кодові точки всіх букв.