pdf2htmlEX包不在主ppa中(它在ppa:coolwanglu/ pdf2htmlEX中),我不能仅仅将pdf2htmlEX添加到Aptfile (这是您指定apt依赖项的地方)。/.apt/usr/lib/x86_64-linux-gnu/libstdc++.so.6: version `GLIBCXX_3.4.20' not found (required by pdf2htmlEX)
pdf2htmlEX
我使用pdf2htmlEX,以便将pdf文件转换为html。之后,我还从文件中提取文本。我遇到一个文件,转换后的html中的文本不可读:。我使用的命令:html上的文本有很多空格和引号-
2"M."Ha h n,"O ."有一个在线工具使用这个库,那里生成的html很好,这使得它不是一个pdf2htmlEX错误,而是一个或多个版本问题。可能是与poppler或字体伪造有关的东西。Supported i