Файли Excel можна конвертувати в CSV за допомогою:
$ libreoffice --convert-to csv --headless --outdir dir file.xlsx
Здається, все працює добре. Хоча кодування встановлено на щось вибагливе. Замість UTF-8 mdash (-), який я отримую, якщо вручну з LibreOffice Calc виконую "збереження як", він дає мені \ 227 ( ). Використання файлу на CSV дає мені "текст без розширеного ISO-ASCII, з дуже довгими рядками". Отже, два питання:
- Що на землі відбувається тут?
- Як сказати libreoffice для перетворення на UTF-8?
Конкретний файл, який я намагаюся перетворити, знаходиться тут .