我正在尝试使用soffice将pdf转换为docx。它将其转换为.docx,但它提供的文本框我无法使用python提供的docx api读取。有没有更好的方法来读取文件,或者有更好的方法将pdf转换成docx,这样我就不会得到文本框了?
soffice --infilter="writer_pdf_import" --convert-to docx "convert_this.pdf"
发布于 2019-12-16 17:27:38
您可以尝试使用Aspose.Words for Cloud将其转换为Word文档。它可以将https://docs.aspose.cloud/display/wordscloud/Convert+PDF+Document+to+Word从固定格式转换为流动格式,因此可以在MS Word中进行编辑。
披露:我在Aspose.Words团队工作。
https://stackoverflow.com/questions/59346156
复制相似问题