Як кодувати файли форм від LATIN1 до UTF-8?


Відповіді:


16

Це можна зробити за допомогою QGIS. Спочатку завантажте свої файли, а потім save asвиберіть спадне меню utf-8, а потім збережіть файл.


7
Слово застереження : для цього рішення роботи qgis потрібно запускати в середовищі LATIN1 / ISO-8859-1, коли ви відкриваєте вхідний файл з форматом, або він не буде читати його правильно. Якщо ви працюєте в навколишньому середовищі UTF8, конверсія може пройти безшумно, пошкоджуючи дані, залежно від даних у файлі форм. BTW, більшість ОС зараз за замовчуванням UTF8.
unicoletti

1
Зауважте, що в деяких ситуаціях це може не працювати, у мене виникли такі проблеми: ( osgeo-org.1560.n6.nabble.com/UTF-8-no-more-td4647456.html )
JaakL

Я намагаюся зберегти файл однієї форми з системи до utf-8, але він не працює. gis.stackexchange.com/questions/219092/…
Мухаммед

27

Якщо припустити, що ви працюєте в Linux і маєте доступ до останньої версії GDAL, ви можете спробувати наступне (з цієї публікації ):

 export SHAPE_ENCODING="ISO-8859-1"
 ogr2ogr output.shp input -lco ENCODING=UTF-8

Примітка: LATIN1 також повинен працювати замість ISO-8859-1.

У Windows НЕ встановлюйте SHAPE_ENCODING, ogr2ogrне розпізнає ISO-8859-1і не встановлює LATIN1.


Просто для уточнення, "недавнє" тут, мабуть, означає 1.9.x. Я спробував це з 1.8.1, і це не спрацювало, спробував ще раз з 1.9.1 і так.
Міхал Мігурський

Не працював для мене в Windows.
Павло Радзивиловський

Почав працювати в Windows, оновив відповідь.
Flup

Чи знаєте ви, чи можу я SHAPE_ENCODINGдесь шукати список дійсних значень ?
JJD

1
@JJD Це те саме, що використовується iconv: gnu.org/software/libiconv
unicoletti

3

Якщо моє розуміння Shapefiles правильне, то частина, яка чутлива до кодування, - це база даних атрибутів, що міститься у файлі DBF.

Ось відповідь, яка допомогла мені вирішити цю проблему за допомогою LibreOffice Calc / Base:

/gis//a/3663/17998

Додатковою перевагою є те, що ви можете відкрити файл DBF, використовуючи окремий набір символів, і таким чином дізнатися, що насправді є поточним кодуванням.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.