腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
使用
R
识别
PDF
表格
、
、
我正在尝试从一些
pdf
报告中的表中提取数据。 我已经看到一些
使用
pdftools和类似包的示例,我成功地获得了文本,但是,我只想提取表。 有没有一种方法可以
使用
R
来
识别
和提取仅表?
浏览 36
提问于2017-05-24
得票数 23
1
回答
OCR
表格
识别
V2是否支持
PDF
多页
识别
?
浏览 132
提问于2022-06-15
1
回答
OCR
表格
识别
是否支持Excel
表格
合并?
浏览 147
提问于2022-06-15
1
回答
我们应该
使用
什么python库来从
PDF
中提取包含复杂标题的表?
、
、
、
、
我尝试
使用
很多库来从
PDF
中提取
表格
,比如: camelot,tabula,PDFPlumber,PDFTabExtract…但是他们不会给出一个好的结果。
使用
camelot,我不能有一个适用于我
PDF
中所有页面的脚本。
使用
Tabula时,当
表格
有一个旋转的文本标题时,我得到了一个令人困惑的数据帧。
使用
PDFPlumber时,我遇到了流表的问题(它只适用于晶格表),而
使用
PDFTabExtract时,当文本被旋转时,它会忽略它。 有没
浏览 13
提问于2019-06-10
得票数 0
2
回答
如何
识别
pdf
文件中的
表格
、
、
我想要
识别
一个
pdf
文件中的
表格
。在C#中
使用
了什么SDK来
识别
pdf
中的表,以及一些逐个单元格读取的机制,有人能推荐一下吗?
浏览 1
提问于2011-08-06
得票数 1
回答已采纳
1
回答
获取
PDF
中嵌入的表数
、
下面的代码从
PDF
中提取
表格
。install.packages("tidyverse") n_tables <- extract_tables("filename.
pdf
我们是否可以绕过实际的
表格
提取步骤,直接
使用
tabulizer或任何其他
R
包从
pdf
中获取
表格
计数?
浏览 3
提问于2018-08-22
得票数 0
2
回答
如何确定
PDF
是否被标记?
、
我如何知道
PDF
是否被标记?我正在开发一个程序,可以在
PDF
文件中复制一个文本并在我的应用程序中显示它,所以我尝试测试这个
PDF
文件,我从一个
PDF
文件(普通Copy+Paste)中复制了一个表,并将它粘贴到MS中。结果是没有
表格
的普通文本。当您从
pdf
文件中复制表并将其粘贴到Word中时,会出现一些问题,使其成为图像。这是真的吗?
浏览 6
提问于2012-10-04
得票数 2
回答已采纳
2
回答
使用
Azure表单
识别
器提取
PDF
表格
数据
、
、
、
我正在工作的发票处理项目
使用
Azure从
识别
器。所有发票都是
PDF
格式的。我正在
使用
一个自定义的表单
识别
器与标签。我可以从
PDF
中提取一些数据,如发票编号、发票日期、金额等,但我想
使用
Azure表单
识别
器从
pdf
中提取
表格
数据,但它没有正确读取表。是否有办法
使用
Azure表单
识别
器正确地从
PDF
中提取表数据? 扫描表是我们的应用程序的基本要求,它将决定我们是否<e
浏览 10
提问于2020-09-15
得票数 0
1
回答
未捕获的单元:无法读取未定义的jspdf的属性“TypeError”
、
、
我有一个速度模板文件,我正在尝试将其转换为
pdf
。在谷歌了一下之后,我发现了一个名为JSPDf的框架。当我尝试
使用
它时,它给我错误的Uncaught :无法读取未定义的jspdf的属性'cells‘。function html_to_
pdf
() { // source can be HTML-formattedAJS.l
浏览 0
提问于2015-08-31
得票数 4
1
回答
OCR可以
识别
PDF
文件吗?
浏览 178
提问于2022-06-15
1
回答
我想阅读带有图像、文本和
表格
的
PDF
内容
我是一个非常新的阅读
PDF
内容与图像,文本和
表格
。我浏览过许多网站,我
使用
iTextSharp (TextWithFontExtractionStategy)读取内容并将其转换为HTML,我只处理文本。我在许多网站上寻找建议,但我找不到解决方案。现在,我想要实现的是我想从
PDF
中读取包含文本、图像和
表格
的内容,并将其转换为HTML。我知道
识别
图像和
表格
是很困难的。对于图像-我不想从
PDF
中提取图像,因为我要为图像保留一些占位符,以便我可以给出一些替代文
浏览 2
提问于2019-01-04
得票数 0
2
回答
无法
使用
表格
将
PDF
文件的多个
PDF
页面转换为CSV
、
、
、
我有
PDF
文件,其第一页的数据格式是不同的,但其余的页面有相同的
表格
格式。我想转换这个
PDF
文件,其中有多页到CSV文件
使用
Python Tabula。当前代码能够将
PDF
转换为CSV,如果
PDF
只有2页,如果它有两页以上,它就会给出超出范围的错误。我想计算
PDF
文件的
PDF
页面的总数,并根据相同的,我希望python脚本转换为不同的数据帧的
PDF
到CSV。
浏览 3
提问于2021-11-18
得票数 1
2
回答
如何
使用
Tesseract从车辆的认证卡中获取文本区
、
、
我尝试过
使用
Tesseract,但效果并不完美。很多信息都丢失了。我想扫描法国车辆的登记证书,我必须将数据恢复到数据库中。你可以在下面的文件中找到,这是一份法国注册证。
浏览 19
提问于2017-02-17
得票数 0
1
回答
如何
使用
python
识别
pdf
中的图形?
、
、
、
新的
pdf
解析。输入-
pdf
与一个图形,如这一个。输出应为-真或假也许还有别的办法? 谢谢!
浏览 5
提问于2022-11-17
得票数 0
1
回答
Azure Language Studio没有显示有关OCR的python脚本中的文本内容
、
、
我正在研究word文档的OCR,以
识别
文档中提到的内容。我注意到OCR生成的python代码没有在语言工作室中自动生成python脚本中显示文档中可用的内容。我只想得到python脚本结构,在那里我可以看到标记,这些标记专注于
识别
没有表内容的句子。 我要找的方法对不对?任何解释需求的流程都是非常感谢的。
浏览 14
提问于2022-06-15
得票数 -1
回答已采纳
1
回答
我想要更改
pdf
,在html2
pdf
中查看html
目前,当我
使用
html2
pdf
转换成
PDF
格式时,我的HTML页面被扭曲了。我的标题不像我设计的那样。如何根据css设置标头值?请指点。 谢谢
浏览 3
提问于2014-04-15
得票数 0
回答已采纳
1
回答
表未被
识别
、
、
、
import pandas as pdFileName="Filepath"print DF3 import camelottables = camelot.read_
pdf
(FileName,pages='1-end') print t
浏览 10
提问于2019-02-28
得票数 0
2
回答
识别
已提交的网页网址以供联络
表格
7
、
我目前正在
使用
一个单一的形式通过联系
表格
7的访问者下载我的网站上的
pdf
文件。一旦他们填写
表格
并点击提交按钮,相关的
pdf
文件将被下载。但是,我想导出有关访问者的信息,无论谁下载了特定页面的
pdf
文件。我从联系
表格
DB下载了报告,但是它没有显示访问者提交表单的任何链接或页面名称。我相信有一种方法可以
识别
或解决这个问题。 谢谢
浏览 4
提问于2017-08-15
得票数 1
回答已采纳
1
回答
是否可以从pandas dataframe中的图像中读取表数据?
、
、
、
图像将包含表数据,如下所示:请告诉我有没有办法从图像中读取
表格
内容到pandas数据帧中。谢谢!
浏览 2
提问于2021-10-08
得票数 2
1
回答
如何
使用
R
中的代码将html导出为
PDF
格式
、
、
我正在尝试
使用
html代码在
R
中制作高质量的
表格
,但是我想将最终的
表格
导出为
pdf
格式,然后我可以在插图和Photoshop中打开进行编辑。我想导出为
pdf
,这样我就可以指定
表格
的尺寸。我几乎没有
使用
html的经验,但到目前为止,我已经让这个表正常工作了,所以我将坚持
使用
它。由于(现在)显而易见的原因,我尝试过的唯一其他方法不起作用:
pdf
("Table.
pdf
", width
浏览 4
提问于2017-02-14
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
177行代码python使用人脸API进行本地图片情绪识别并存入EXCEL表格
手机扫描文件怎么弄成电子版表格?使用它来帮你快速扫描识别吧!
如何把pdf转换成excel表格?几个步骤轻松转换
Readiris Pro中文版分享
pdf表格怎么转换成excel,推荐一个好用的转换方法
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券