腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4327)
视频
沙龙
1
回答
帮助Canon CanoScan LiDE扫描
PDF
文档
、
、
、
当我使用Windows 7中的扫描仪,并将扫描过的书籍页保存为
PDF
格式时,我可以打开
PDF
扫描页面并直接从其中复制文本以粘贴到Google或任何LibreOffice文档。我通过简单的扫描将页面扫描为文本,并将其保存为
PDF
格式。但是在Ubuntu中,当我打开扫描的
PDF
页面时,它会打开OK,但是我不能复制文本。
浏览 0
提问于2014-03-16
得票数 2
回答已采纳
1
回答
如何
使用doc取器在
PDF
文件中搜索文本?
、
、
我试图在
PDF
文件中找到一些文本,但结果并不准确!举个例子,我有两个
PDF
文件,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个
PDF
文件?
PDF
文件之间有什么区别吗?在一个
PDF
中,我只有文本,而其他
PDF
是文本和图像,这是从扫描页面。陷阱是什么? P.S.:这两个
PDF
文件位于同一个目录中。
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
2
回答
可将
OCR
文本插入回源
PDF
的
OCR
库
、
是否有库(或可执行文件)可以
OCR
PDF
(通常是通过扫描纸张创建的
PDF
),并将
识别
出的文本重新注入到
PDF
中?很可能是扫描图像背后的隐形
文字
。 最好是开源的。(目标:我有一个巨大的由Lucene索引的
PDF
文件库。如果
PDF
包含文本,Lucene将更容易找到哪些
PDF
是相关的。)
浏览 3
提问于2011-02-28
得票数 2
2
回答
Tesseract
OCR
混淆了0到8的斜线
、
、
我曾在终端字体上训练过tesseract,但无论
如何
,我都无法让它
识别
出0。我正在使用jTessEditor创建培训tif和框。即使在验证时,它也会将所有的0读为8s。我遗漏了什么吗?
浏览 8
提问于2018-10-31
得票数 22
1
回答
关于拆分
PDF
和
OCR
识别
、
、
、
我有很多
pdf
文档,它们都是扫描过的
文字
版本。我需要在
pdf
中拆分一个页面。 例如,如果有1个页面。我需要将一页分成页眉部分,页脚部分,主体部分和侧面部分。我知道Python的
PDF
和
OCR
库,但我找不到任何关于拆分单个页面的内容。 然后,最后希望将
pdf
页面的拆分部分传递给
OCR
,以
识别
字符并将输出转换为csv或文本文件。 提前感谢您……
浏览 18
提问于2021-04-20
得票数 0
回答已采纳
3
回答
文字
识别
OCR
接口本地图片下载失败?
、
、
、
用
文字
识别
OCR
的Python接口调用来对本地图片进行
识别
,报错“下载失败”,FailedOperation.DownLoadError message:下载失败。参照这个官方样例https://github.com/TencentCloud/tencentcloud-sdk-python/blob/master/examples/
ocr
/v20181119/general_fast_
ocr</em
浏览 1648
提问于2020-03-07
1
回答
如何
在PDFTextExtractor上使用iTextSharp
我想用iTextSharp从
pdf
文件中检索文本。但是,我无法像在itextsharp(itext)的JAVA中那样使用PDFTextExtractor。私有字符串readPDFOffline(string fileUri);检索此
Pdf
的文本内容;*返回contentOfflineFile
浏览 3
提问于2010-12-10
得票数 3
回答已采纳
1
回答
如何
从
PDF
中提取音乐符号?
、
、
、
我试图用另一种内置字体渲染
PDF
格式的音乐符号,但我不知道怎么做。gs -dBATCH -dNOPAUSE -sDEVICE=txtwrite -sOutputFile=Betlem_
pdf
.txt Betlem.
pdf
iconv.e
浏览 5
提问于2019-07-22
得票数 0
回答已采纳
1
回答
OCR
表格
识别
是否支持Excel表格合并?
浏览 157
提问于2022-06-15
1
回答
OCR
文字
识别
?
浏览 169
提问于2022-06-15
1
回答
使用Python PyPDF2从扫描的
pdf
(图像)中提取文本
、
、
、
我一直在尝试从扫描的
PDF
中提取文本(具有不可选文本的图像)。我想要的信息,包含日期,发票编号从
pdf
链接()。from PIL import Imagepage =
pdf
_reader.getPage
浏览 2
提问于2020-05-27
得票数 1
回答已采纳
2
回答
在WinForm中寻找
OCR
库
、
、
是否有任何免费/付费的
OCR
库能够捕获
PDF
格式的发票数据?需要有一个低的错误率。我们需要对这些数据进行进一步的处理。
浏览 0
提问于2019-06-10
得票数 1
1
回答
是否可以使用Google脚本将位于Google中的不可搜索的
PDF
转换为可搜索的
PDF
?
、
、
、
我想使用Google 将不可搜索的
PDF
转换成可搜索的
PDF
,其中的文本是覆盖在
PDF
上的。
PDF
位于我的谷歌驱动器,我不想上传文件到另一个网站或下载的文件,以进行转换。我没有找到任何显示文本可以被覆盖的资源,类似于Acrobat
如何
进行
OCR
转换。那么,是否有可能使用气体进行覆盖呢?我只看到人们转换成文本或文档文件。
浏览 1
提问于2019-07-09
得票数 1
回答已采纳
1
回答
从
PDF
中获取树的文件(最好使用Python)
、
、
、
、
我想制作一系列文件,其中包含了这个
PDF
()中的树。文件的名称将是左边对应的树号(t0、t1等)。 我试图使用python提取相关信息和树,但我遇到了麻烦。我怎样才能从这个
PDF
中获取我想要的文件呢?能用Python完成吗?还有更简单的方法吗?或者,我获得
PDF
的网站()有另一种形式的树(例如: t27 S##1#l# NP#0#2#l#s NP#0#2#r#s VP##3#l# V##4#l#h V##4#r#h NP#1#5#l#s NP
浏览 0
提问于2018-09-20
得票数 0
回答已采纳
8
回答
OCR
文字
识别
技术有哪些应用?
OCR
是实时高效的定位与
识别
图片中的所有
文字
信息,返回
文字
框位置与
文字
内容。支持多场景、任意版面下整图
文字
的
识别
,以及中英文、字母、数字的
识别
。简单来说就是将图片上的
文字
内容,智能
识别
成为可编辑的文本,这么强大的功能在我们生活当中有哪些应用呢?
浏览 3646
提问于2018-08-24
1
回答
人脸核身的费用中包含
OCR
身份证
识别
吗?
、
浏览 156
提问于2022-06-15
0
回答
ocr
识别
文字
的结果
如何
还原呢?
ocr
识别
文字
返回结果以后,能否再还原回去,与原图做对比吗?又是
如何
还原的呢
浏览 124
提问于2022-01-15
1
回答
文字
识别
能否实现全书某个关键词搜索?
浏览 136
提问于2022-06-15
1
回答
腾讯云
文字
识别
和腾讯优图
文字
识别
?
请问腾讯云官网的
文字
识别
和腾讯优图网站上的
OCR
文字
识别
有什么区别啊,这两个接口调用的好像不一样?
浏览 654
提问于2020-03-30
1
回答
如何
使用
OCR
文字
识别
?
浏览 136
提问于2022-06-15
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
对PDF进行ocr文字识别怎么操作?扫描识别软件推荐
[windows] Umi-OCR 免费 · 离线 · 文字识别软件 支持PDF识别 开源
PDF怎么用OCR来识别文字,这个人工智能OCR工具绝了
OCR-文字识别
OCR文字识别工具
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券