我正在使用pdfplumber从pdf中提取表格。但是,正在使用的表没有可见的垂直线分隔内容,因此提取的数据被分成3行和1列。 ? 我想把上面的表格排成13行。import pdfplumberimport numpy as np
with pdfplumber.open('test.pdf') as pdf:p
我只想从一个“富”pdf文档中提取核心文本,这意味着它有很多我不感兴趣的表格、图表、框、页脚等等。我尝试使用一些常见的python包,如PyPDF2、pdfplumber或pdfreader.The,显然它们提取了pdf中所有的文本,包括上面列出的那些我不感兴趣的部分。PdfReaderpage = file.pages[10]
t