Я хотів би викликати утиліту командного рядка в Mac OS X 10.8, яка дає мені можливість перетворити текстовий файл, збережений у стандартному західному коду Mac OS Roman, в кодування в більш загальний UTF-8.
Я буду викликати утиліту з створеного мною AppleScript. AppleScript надзвичайно повільний під час роботи з дуже великими текстовими блоками. Як таке, я хочу зробити свій аналіз тексту та перетворення за допомогою командного рядка OS X. Я знайшов інструмент під назвою "sed", який дозволяє мені розбирати текст. Однак є ще багато елементів файлу, які потрібно очистити, символи, які виглядають як сміття, якщо файл відкритий як utf-8 (наприклад, розумні лапки та еліпси).
Я думаю, що форсування перетворення кодування тексту може допомогти усунути всі символи, які не входять до utf8. Однак я не бачу, як "sed" може легко перетворити кодування тексту.
Я вже зберегла файл temp txt, як MacRoman, на диск, використовуючи вбудовану програму AppleScript.
У когось із вас є ідеї щодо вбудованого інструменту командного рядка, який може перетворити кодування тексту? Командний рядок для продуктивності та вбудованого, оскільки інші користувачі мого сценарію не обов'язково матимуть належний набір інструментів, якщо він не вбудований.
Спасибі за вашу допомогу!