Виправте пошкоджені імена файлів Unicode в zip-архіві


3

Колега дав мені zip-архів деяких даних, які мені потрібно проаналізувати, але, на жаль, файли були пошкоджені десь по дорозі, або при створенні архіву, або при вилученні їх на моїй машині.

В архіві є 3000 файлів, у файлах яких містяться японські символи. Він застібнув його на машині Windows, а я використовую Mac. Якщо я двічі клацніть по архіву, то я отримаю назви файлів, які виглядають приблизно так:

0001_rt_ñºéå-ïÅí ñºéå-àÍî _ÉAÅ[ÉãÉeÉBÅ[.dat

З іншого боку, якщо я використовую 'unzip' у командному рядку, виходить той самий файл, що і

0001_rt_%FB+%C4%EE-%F2%FC%C6-%FB+%C4%EE-%EA%DB%F6-_%E2A%FC[%E2%EF%E2e%E2B%FC[.dat

Вміст файлів чудовий (вони не містять жодних японських символів, лише цифри), але мені потрібно знайти оригінальні назви файлів.

Чи можна відновити правильні імена файлів, не маючи доступу до оригінальних файлів, які є на іншому комп’ютері в іншому місті? Я готовий написати швидкий сценарій Python, якщо це можливо, але я не знаю багато про кодування символів, тому я не знаю, як це зробити.


Ви впевнені, що імена файлів пошкоджені, тому що це звучить більше як проблема OS X, а не проблема зіарного архіву. Чи здаються файли пошкодженими на машині Windows?
Рамхаунд

Я думаю, це може бути випадок - я відредагував це, щоб зробити це зрозумілим. У мене немає доступної машини Windows, щоб перевірити її.
Натаніель

Відповіді:


4

Unarchiver для OS X - це безкоштовна програма з відкритим кодом, яка може вирішити цю проблему, і він підкаже вам про кодування імен файлів, коли він не може його правильно визначити.

Це скасує програму для розпакування файлів за замовчуванням OS X, але я вважаю її набагато потужнішою, ніж вбудована.


Щиро дякую! Це не підказало мені, але просто отримало назви файлів правильно вперше.
Натаніель
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.