我得到了这个错误,而解析的PDF文件使用pypdf2,我是随同错误的PDF附件。I have attached the PDF to be parsed please click to view 有人能帮上忙吗?import PyPDF2
read_pdf = PyPDF2.PdfFileReader(pdfName)page = read_pdf.getPage(0)
page_content = page.e
我编写了一个从PDF文档中提取文本的程序。但一份PDF文件给了我空的短信。我可以在Acrobat中打开PDF文件,它可以正常工作。我的代码可以很好地处理其他PDF文件,所以我想知道是什么导致了这个问题。我用了PyPDF2和PyPDF2,但结果是一样的。所以这个文件一定有问题: from PyPDF2 import PdfReader for page in reader.pages
我创建了一个简单的方法,可以从PDF文件中提取文本并将该文本插入到txt文件中。问题是,它只提取PDF的文本,而不是从插入到pdf中的图像中提取文本。我尝试了这个,但不知道如何实现。//usingsusing iText.Kernel.Pdf.Canvas.Parser;using System.IO;
using Syst