Є багато простих текстових файлів, кодованих у варіантах діаграм.
Я хочу перетворити їх усіх у UTF-8, але перш ніж запустити iconv, мені потрібно знати його оригінальне кодування. У більшості браузерів є Auto Detect
можливість кодування, однак я не можу перевірити ці текстові файли по одному, оскільки їх занадто багато.
Тільки знаючи оригінальне кодування, я потім можу перетворити тексти iconv -f DETECTED_CHARSET -t utf-8
.
Чи є утиліта для виявлення кодування простих текстових файлів? ЦЕ НЕ повинно бути 100% досконалим, я не заперечую, якщо 100 файлів неправильно перетворено в 1 000 000 файлів.
python-chardet
у Rebu Unipo Unipo.