Для компонування маємо наш відомий текст "Lorem ipsum", щоб перевірити, як він виглядає.
Я шукаю набір файлів, що містять Текст, закодований декількома різними кодуваннями, які я можу використовувати у своїх тестах JUnit для тестування деяких методів, що мають справу з кодуванням символів під час читання текстових файлів.
Приклад:Наявність ISO 8859-1
закодованого тестового файлу та Windows-1252
закодованого тестового файлу. Windows-1252 повинен викликати відмінності в регіоні 80 16 - 9F 16 . Іншими словами, він повинен містити принаймні один символ цієї області, щоб відрізняти його від ISO 8859-1.
Можливо, найкращим набором тестових файлів є той, де тестовий файл для кожного кодування містить один раз усі його символи. Але, можливо, я не знаю про що - нам усім подобається це кодування, так? :-)
Чи існує такий набір тестових файлів для питань кодування символів?