腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何使用doc取器在
PDF
文件中搜索文本?
、
、
我试图在
PDF
文件中找到一些文本,但结果并不准确!举个例子,我有两个
PDF
文件,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个
PDF
文件?
PDF
文件之间有什么区别吗?在一个
PDF
中,我只有文本,而其他
PDF
是文本和图像,这是从扫描页面。陷阱是什么? P.S.:这两个
PDF
文件位于同一个目录中。
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
1
回答
如何从
PDF
中提取音乐符号?
、
、
、
我试图用另一种内置字体渲染
PDF
格式的音乐符号,但我不知道怎么做。gs -dBATCH -dNOPAUSE -sDEVICE=txtwrite -sOutputFile=Betlem_
pdf
.txt Betlem.
pdf
iconv.exe -f MAC
浏览 5
提问于2019-07-22
得票数 0
回答已采纳
1
回答
是否可以使用Google脚本将位于Google中的不可搜索的
PDF
转换为可搜索的
PDF
?
、
、
、
我想使用Google 将不可搜索的
PDF
转换成可搜索的
PDF
,其中的文本是覆盖在
PDF
上的。
PDF
位于我的谷歌驱动器,我不想上传文件到另一个网站或下载的文件,以进行转换。我没有找到任何显示文本可以被覆盖的资源,类似于Acrobat如何进行
OCR
转换。那么,是否有可能使用气体进行覆盖呢?我只看到人们转换成文本或文档文件。
浏览 1
提问于2019-07-09
得票数 1
回答已采纳
2
回答
Tesseract
OCR
混淆了0到8的斜线
、
、
我曾在终端字体上训练过tesseract,但无论如何,我都无法让它
识别
出0。我正在使用jTessEditor创建培训tif和框。即使在验证时,它也会将所有的0读为8s。我遗漏了什么吗?
浏览 8
提问于2018-10-31
得票数 22
4
回答
哪些工具可以在Mac上将扫描过的纸张文件转换成可搜索的文本
pdf
?
、
、
、
、
我需要将扫描文档转换为mac上可搜索的文本
PDF
。它不需要免费,只需要比Acrobat更低的成本。
浏览 0
提问于2015-03-02
得票数 2
回答已采纳
4
回答
一种基于
OCR
的
PDF
文本提取方法
、
、
是否有人尝试过使用
OCR
库和Java从
PDF
中提取文本?你认为什么是最可靠的文本提取库?我见过的大多数方法(tesseract、GOCR)都是C库,需要编写一些JNI代码。
浏览 2
提问于2009-04-22
得票数 6
2
回答
在WinForm中寻找
OCR
库
、
、
是否有任何免费/付费的
OCR
库能够捕获
PDF
格式的发票数据?需要有一个低的错误率。我们需要对这些数据进行进一步的处理。
浏览 0
提问于2019-06-10
得票数 1
1
回答
我想从
OCR
数据中提取表信息。
、
、
、
我想从
OCR
数据中提取表格信息,我有原始文本和它的文本。我试过pytesseract,但找不到实际的实现。我试过这个: 这种方法对我一点用也没有。我希望从
OCR
数据中获得此表的表格结构,以供进一步处理。
浏览 3
提问于2019-01-20
得票数 0
1
回答
带有Aspris库的java -
OCR
、
、
、
这是我使用Aspris库编写的代码,但"recognize“方法有问题:
Ocr
ocr
= new
Ocr
();String s =
ocr
.recognize(theImage,
Ocr
.RECOGNIZE_TYPE_ALL,
Ocr
.OUTPUT_FORMAT_PLAINTEXT); <
浏览 3
提问于2015-08-14
得票数 0
1
回答
如何判断
pdf
文件中隐藏的文本层是否来自
OCR
?
我见过一些
pdf
文件后,
OCR
有非常准确的文本(无论是在
识别
率,在文本对齐图像)。 如果
pdf
文件中隐藏的文本层是否来自
OCR
,那么Unix/Linux工具会帮助我知道什么呢?
浏览 0
提问于2014-12-07
得票数 2
1
回答
如何快速从图像中扫描可搜索的
pdf
?
、
、
、
、
我想扫描文件与tesseract框架中的迅速和生成
pdf
文件,可以搜索。 实际上,我使用此代码将图像转换为文本,但我希望生成主格式的图片,但格式将随着转换为文本而改变,并生成
pdf
文件。
浏览 2
提问于2020-10-13
得票数 0
回答已采纳
1
回答
保存并重新加载Abbyy的光学字符
识别
结果
、
、
、
假设我已经在Abbyy FindeReader中对多个
PDF
进行了光学字符
识别
。是否可以稍后在Abbyy FineReader中重新加载光学字符
识别
结果,以便纠正光学字符
识别
错误?我的想法是,我希望将执行
OCR
和(稍后)更正
OCR
结果分开
浏览 36
提问于2020-10-09
得票数 0
回答已采纳
1
回答
检查是否已从Word/Google Docs导出
PDF
、
、
、
我正在做一些OCRing
PDF
的工作,我很好奇是否有一种方法可以检查一个
PDF
是否已经从Word (或Google Docs)导出。我可以检查
PDF
是否已经用Xpdf的pdffonts进行了
OCR
。我知道Word和Google Docs会自动
OCR
导出的
PDF
,所以如果我发现
PDF
没有
OCR
,我就知道它没有导出。但是,如果它已经光学字符
识别
,有没有办法检查的
PDF
是否从Word/Google Docs导出
浏览 2
提问于2013-06-14
得票数 0
1
回答
关于一个好的自由软件/网站将
pdf
转换为EPUB的建议
、
我发现,当我将一个包含大量文本的
pdf
文件转换成EPUB格式(例如书籍)时,它们会在同一句话之间被分割成段落,我使用过-量程,Toepub.com和许多在大坏网站上可以找到的网站;-)。
浏览 0
提问于2019-11-14
得票数 0
1
回答
在Tesseract
OCR
中是否有从
PDF
中查找字符串和删除页面的属性?
、
、
、
、
我试图在Tesseract
OCR
中将Image转换成文本
PDF
。在中间,我需要检查封面页,并从结果中删除。在Tessaract
OCR
中是否可以根据封面的特定属性(封面文本匹配)来
识别
封面。或者,我是否需要获取tessetact
OCR
结果的全部输出,并提供我的逻辑来扫描
PDF
和删除封面页。我非常困惑,任何帮助都将不胜感激。
浏览 1
提问于2018-09-20
得票数 0
回答已采纳
1
回答
OCR
多幅图像合并成一个
PDF
格式
、
、
有没有人有经验,如何
OCR
几个图像,并创建一个输出
PDF
文件与
识别
的文本在C#中的Nicomsoft
OCR
?看起来它可以做到,但是我的C#代码由于某些原因没有生成任何
PDF
:NsOCR.Engine_InitializeAdvancedImgObj); { NsOCR.Img_LoadFile(ImgObj, Imag
浏览 13
提问于2015-04-28
得票数 1
回答已采纳
1
回答
是否有任何不基于
OCR
的通用布局分析库或工具?
、
我正在寻找布局分析库或工具(最好是开源的),可以应用于文本
PDF
,以
识别
主要文本内容与侧栏,章节标题,章节标题(甚至可能是具有装饰/阴影和下划线的花哨的标题)等。我遇到了像OCRopus这样的工具,它们使用光学字符
识别
和图像
识别
来
识别
布局。有没有库可以在没有
OCR
的情况下做同样的事情?可以从文本
PDF
中提取文本和图像,并将包含文本和图像位置的输入提供给该工具;对于此类文件使用
OCR
将是相当繁琐的。
浏览 2
提问于2013-05-08
得票数 2
回答已采纳
1
回答
如何下载谷歌扫描的.
pdf
OCRed?
、
我有一个电子邮件与扫描的.
pdf
附加在我的Gmail帐户。当我点击“查看”,我看到谷歌有OCRed它。当我单击“下载”时,
PDF
是原始的,即不包含OCRed。如何通过谷歌下载内容为.
pdf
的OCRed文件?
浏览 0
提问于2012-11-26
得票数 2
1
回答
从
PDF
中获取树的文件(最好使用Python)
、
、
、
、
我想制作一系列文件,其中包含了这个
PDF
()中的树。文件的名称将是左边对应的树号(t0、t1等)。 我试图使用python提取相关信息和树,但我遇到了麻烦。我怎样才能从这个
PDF
中获取我想要的文件呢?能用Python完成吗?还有更简单的方法吗?或者,我获得
PDF
的网站()有另一种形式的树(例如: t27 S##1#l# NP#0#2#l#s NP#0#2#r#s VP##3#l# V##4#l#h V##4#r#h NP#1#5#l#s NP
浏览 0
提问于2018-09-20
得票数 0
回答已采纳
5
回答
是否有
OCR
无法
识别
的字体?
为此,我将其页面转换为图片,并将其添加回
PDF
文件。主要的问题是,任何
OCR
程序都可以恢复整个书面文本,特别是页面将是清晰的(而不是扫描的书),这将提高
OCR
的准确性。那么,有没有
OCR
无法
识别
的字体呢?否则,有没有一种技术可以让我的文档只被人类阅读,而不被
OCR
识别
?(例如,添加特定的背景,等等) 提前谢谢你。
浏览 3
提问于2012-11-13
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
对PDF进行ocr文字识别怎么操作?扫描识别软件推荐
PDF怎么用OCR来识别文字,这个人工智能OCR工具绝了
[windows] Umi-OCR 免费 · 离线 · 文字识别软件 支持PDF识别 开源
OCR识别软件,有什么可以ocr识别的软件
pdf识别软件哪些好用?分享超级实用的一款ocr识别软件!
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券