腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
从
PDF
中提取文本,并将提取的文本保存在
Excel
或其他地方
、
我想要一个简单的方法,从
pdf
中提取文本,并将文本保存到
Excel
中。 谢谢!
浏览 16
提问于2020-07-13
得票数 0
1
回答
将扫描的
PDF
表格转换为
Excel
、
、
、
我有一个扫描的
PDF
,其中有一些表格格式的随机数据,并希望将其复制到
Excel
工作表。 我试过使用数字
PDF
,使用'tabula‘来提取表格,但扫描的
PDF
需要
OCR
(我在google上看到的)。我知道涉及到
OCR
(Tesseract),但不知道我应该采取什么方法来解决这个问题。
浏览 7
提问于2019-06-20
得票数 0
2
回答
为什么我用魔杖从
pdf
中提取图像jpg,它会在文本上变成黑色背景?
、
、
、
、
我对一些
pdf
文件有问题。我需要将它们转换为jpg图像,使它们可用于
OCR
,但当我转换其中的一些,魔杖
转
我的jpg在那里有一个黑色的背景文本。我看到这是一个关于空间颜色的常见问题。这似乎发生在word转换为
pdf
文件的文件中,其中空间颜色变成了CMYK。Tesseract
OCR
仅接受空间颜色RGB。我已经写了一个可以转换的python脚本,但我想解决这个问题。你能帮我一下吗?原页
pdf
? 已将
pdf
转换为jpg
浏览 51
提问于2019-04-22
得票数 1
回答已采纳
1
回答
在
PDF
中用python执行
OCR
有可能吗?
、
、
、
在
PDF
中用python执行
OCR
有可能吗?我正在尝试构建一个程序,从每一个
PDF
表格中提取一些信息,比如Autodesk BIM360所做的事情。
浏览 6
提问于2022-05-26
得票数 -2
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件进行批处理,更多
、
、
、
、
我使用ScanSnap S1500M将所有纸质文档扫描到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 我应该用自动售货
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
1
回答
AttributeError:“NoneType”对象没有属性“语言”
目标:1.选择
PDF
2. tabels 3.使用单文件.exe扩展表格 File "
OCR
_Menu.py", line 26, in <module> File "ocrmypdf\_validation.py", line 240, in che
浏览 11
提问于2022-07-06
得票数 0
1
回答
PDF
数据的提取与挖掘
我有一个
pdf
档案(入学申请)。我想读取/搜索
pdf
和提取具有类似含义的术语,然后将这些数据转换为DataFrame以保存为xlsm文件。帮助!
浏览 0
提问于2020-01-08
得票数 2
3
回答
用嵌入式字体从
PDF
文件中提取文本
、
、
、
、
我有一个
PDF
文件包含一些表格数据。 然而,
OCR
解决方案并不十分精确(大约80%的单词匹配)
浏览 2
提问于2012-09-07
得票数 4
回答已采纳
4
回答
运行反引号/exec()时的PHP路径问题
、
、
即$f = `java -jar /
OCR
/
ocr
.jar /Folder/$path /
ocr
/output.txt`;java -jar /
OCR
/
ocr
.jar /Folder/Sub\ Folder/filetoocr.
pdf
/
浏览 1
提问于2010-04-15
得票数 0
2
回答
如何将
PDF
转换为JSON/
EXCEL
/WORD文件?
、
、
、
、
我需要从
pdf
文件中获取数据及其标头,以便进一步与DB数据进行比较 我试着使用pdfbox,google vision
ocr
,itext,但是所有的库都没有结构和头文件。示例: Date\nNumber\nStatus\n12\12\2020\n442334\delivered 我会尝试将
pdf
转换为
excel
/word并从中获取数据,但为了实现这一点,我需要读取
pdf
并将数据写入
excel
/word。
浏览 54
提问于2020-04-17
得票数 0
回答已采纳
1
回答
在修改和部署更新之后,查询非常缓慢。
查询 SELECT dv.id,dv.client_id,b.name block_name,dv.is_
ocr
_pending,dv.time,dv.label,dv.is_
pdf
_broken,dv.is_
pdf
_scan,dv.
ocr
_recall_id,dv.
ocr
_vatno,cv.name
ocr
_vatno_name,dv.
ocr
_vatno_country,dv.
ocr
_is_vatno_verified,dv.
ocr
浏览 0
提问于2019-01-06
得票数 0
回答已采纳
1
回答
用于搜索
pdf
中关键字并给出页码的宏
、
我想要一个
excel
宏,它可以在
PDF
中搜索单词,并给出宏找到单词的页码。我有20个单词,我想在
PDF
中搜索。我已将关键字输入到
excel
电子表格的coulmn A中,并希望在coulmn b中填充页码。
浏览 2
提问于2018-06-21
得票数 0
3
回答
将手写数字转换为文本
、
我需要转换一个包含手写数字列的
pdf
表单为文本,并填充一个
excel
电子表格。提前谢谢。
浏览 9
提问于2012-09-05
得票数 1
1
回答
在终端中运行命令,并在输出中包含输入名
、
、
、
、
我在Dolphin服务菜单文件中有这一行,该文件包含用于
PDF
处理的许多其他命令:它的优点是提供表单MY_
PDF
_
ocr
.
pdf
的输出文件,从而保留输入文件的名称。为此,我可以用这句话: Exec=konsole --noclose -e ocrmypdf "%u&
浏览 0
提问于2022-11-30
得票数 0
回答已采纳
1
回答
在r中的
pdf
上执行
ocr
时出错
、
、
、
、
在r中的
pdf
上尝试
OCR
,这给了我错误。运行代码后,也会生成"i.txt“文件,但仍然会出现错误。'"D:/Software_for_
PDF
_
OCR
/xpdf-tools-win-4.00/bin64/pdftoppm.exe D:/
PDF
_
OCR
_File/test.
pdf
-f 1 -lD:/
PDF
_
OCR
_File/t
浏览 3
提问于2017-09-20
得票数 0
3
回答
更改windows批处理中的文件扩展名
、
、
、
到目前为止,我只想将扩展从".
pdf
.
OCR
.
pdf
“更改为".
pdf
”,我得到了以下代码但是它似乎不适用于有多个点的扩展--我做错了什么?
浏览 5
提问于2015-08-27
得票数 1
回答已采纳
1
回答
带有图像的
PDF
文件的
OCR
、
、
我让Tika在
PDF
文件上使用Tesseract,但是如果我给它一个同时具有可搜索文本和图像的
PDF
文件,文本是OCRed两次。有什么办法可以避免这种情况吗?
浏览 4
提问于2020-12-31
得票数 1
回答已采纳
1
回答
使用Python PyPDF2从扫描的
pdf
(图像)中提取文本
、
、
、
我一直在尝试从扫描的
PDF
中提取文本(具有不可选文本的图像)。我想要的信息,包含日期,发票编号从
pdf
链接()。from PIL import Imagepage =
pdf
_reader.getPage
浏览 2
提问于2020-05-27
得票数 1
回答已采纳
1
回答
更新多个列,使其与另一列相等
、
例如,
OCR
0000000006和
OCR
0000000008都有统一的标题06000146.
pdf
。
OCR
0000000001 Yes 100 06000093.
pdf
OCR
0000000004
OCR
0000000006 No 95
浏览 0
提问于2014-03-22
得票数 0
1
回答
两种输入文件类型同时在GNU并行?
、
、
、
然后它将使用tesseract对每个pgm (第二个输入文件类型)执行
OCR
。 export -f generate_pgm PGM="$1" find .{}; parallel --argsep ,,,
ocr
,,, pgm/*.pgm'
浏览 2
提问于2017-07-25
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pdf转excel,分享pdf转excel的方法
电脑中pdf怎么转excel?pdf转excel软件推荐
pdf转excel有什么软件推荐 pdf转excel软件介绍
PDF可以转Excel呢?PDF转Excel需要注意什么
如何PDF 转 Excel?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券