OCRmyPDF 工具通过 OCR 技术扫描出 PDF 文件中的文字部分,可将不可复制的 PDF 文件(扫描版)转换为可复制的 PDF 文件(文字版)。除此之外,OCRmyPDF 还有诸如 PDF 渲染、优化等功能。最重要的是,OCRmyPDF 是开源免费的。
OCRmyPDF 工具在 Windows 和 Linux 上都可以安装使用,详细参见 OCRmyPDF 官方手册。
inputfile.pdf
转为可复制的文字版 outputfile.pdf
ocrmypdf inputfile.pdf outputfile.pdf