Як конвертувати HTML в doc / docx за допомогою OpenOffice або LibreOffice?


1

Я намагаюся перетворити html на doc або docx. Я використовував деякі з доступних класів php, але результати не є хорошими. Цікаво, чи можу я перетворити html-файл у документ, використовуючи деякі офісні програми, такі як LibreOffice або OpenOffice?

LibreOffice (AbiWord) "перетворює" html у файл doc, але без форматування. Я маю на увазі, що я бачу вихідний код html, коли відкриваю файл doc.

abiword --plugin AbiCommand
convert /home/qqq/test/test.htm /home/qqq/test/test.doc doc

І з openOffice нічого не відбувається ..:

soffice --headless --convert-to doc:DOC  /home/qqq/test/test.htm

Я повинен натиснути ctrl + c, щоб повернутися до консолі.

Будь-які ідеї, як конвертувати HTML в Doc? Я можу відкрити html у настільній версії цих двох додатків і зберегти як doc, але, здається, не працює в консольній версії.


IIRC, libre / openoffice не працюватиме, якщо тільки один екземпляр відкритий. Це може бути вашою проблемою з другою командою.
evilsoup

pandoc робить це досить добре, але ви конкретно обмежили своє питання OO / LO, тому я не ставлю цю відповідь ...
Jan

@Jan - встановлений і перевірений. Це не працює. Вона перейменує html в docx, але фактично не перетворює його. :( Я відкритий для будь-якого рішення.
MilMike

Просто повторно перевірено, працює так, як належить: pandoc -s -r html page.html -o output.docx... Це дуже складна програма і до неї треба звикнути.
Jan

якщо ви відкриєте файл output.docx у текстовому редакторі, ви побачите, що це лише вихідний код html. І вихідний код також порушується pandoc. Html в docx не такий же, як мій джерело html - результат виглядає жахливо.
MilMike

Відповіді:


0

Це може бути дурним рішенням або ідіократичним для кількох деталей HTML-файлів, які я використовую, але спробуйте перейменувати файл за допомогою .docx розширення. Я зміг відкрити їх як "слово" файли і згодом зберегти їх як файли слів.


Ну, якщо це працює, то це працює.
Insane
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.