腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(8077)
视频
沙龙
2
回答
可将OCR文本插入回源
PDF
的
OCR库
、
是否有库(或可执行文件)可以OCR
PDF
(通常是通过
扫描
纸张创建
的
PDF
),并将
识别
出
的
文本重新注入到
PDF
中?很可能是
扫描
图像背后
的
隐形
文字
。 最好是开源
的
。(目标:我有一个巨大
的
由Lucene索引
的
PDF
文件库。如果
PDF
包含文本,Lucene将更容易找到哪些
PDF
是相关
的
。)
浏览 3
提问于2011-02-28
得票数 2
4
回答
ORC
文字
识别
怎么
使用下载?
点击进去简介和费用介绍,具体
怎么
使用操作?
浏览 478
提问于2018-04-10
2
回答
如何确定是否
扫描
了.
pdf
文件
的
内容
、
、
因此,我有一个.
pdf
文件,我需要能够确定它是否是通过
扫描
到
PDF
中创建
的
。我正在尝试确定它是否是我可以显示为文本
的
pdf
。$
pdf
->properties['Producer']有没有办法确定我处理
的
是哪种类型
的
.
pdf
文件?
浏览 6
提问于2010-03-05
得票数 3
回答已采纳
1
回答
在OSX中为
扫描
手写便笺
的
PDF
添加文本层
、
、
在课堂上,我喜欢手写
的
笔记,然后我
扫描
它们,然后
把
它们打出来(帮助我记住它们,也使它们易于搜索)。主要
的
问题是,我使用了大量
的
绘图和复杂
的
数学,将数学公式转换成胶乳(或word)非常耗时,绘图要求我保存
PDF
和文本文档。我想做
的
是
把
我自己输入
的
基本文本(没有OCR)添加到
PDF
的
文本层中,这样
PDF
就可以搜索,并且我可以通过不转换数学或绘图来节省很多时间。我已经研
浏览 9
提问于2013-09-12
得票数 2
1
回答
上下文无关文法中符号数与运算
的
区别
、
、
我正在写一个词汇
扫描
器,我想知道我将如何区分一个操作(例如。( -)和一个有符号
的
数字(如。-14)。例如,以下两行都是有效
的
:12 +12+12但是,在程序
的
后面检查第二条语句
的
有效性时,它被标记为无效:一个数字标记不能被另一个没有相邻操作符
的
数字标记所跟随我希望它们被
扫描
为:12 + 12 我可以通过简单地检查前面的字符是否是操作符来实现这一点,如果是这
浏览 6
提问于2013-12-28
得票数 2
回答已采纳
1
回答
关于拆分
PDF
和OCR
识别
、
、
、
我有很多
pdf
文档,它们都是
扫描
过
的
文字
版本。我需要在
pdf
中拆分一个页面。 例如,如果有1个页面。我需要将一页分成页眉部分,页脚部分,主体部分和侧面部分。哪种编程语言和库给了我最大
的
灵活性来完成这样
的
任务,而不需要我做所有繁琐
的
工作。我对Python很熟悉。我知道Python
的
PDF
和OCR库,但我找不到任何关于拆分单个页面的内容。然后,最后希望将
pdf
页面的拆分部分传递给OCR,以
识别<
浏览 18
提问于2021-04-20
得票数 0
回答已采纳
1
回答
如何在Abby Finereader中从用户字典创建连字?
、
、
、
我需要从
扫描
的
文档(
pdf
)中
识别
复杂
的
化学名称。它们包含特殊字符,并以表格格式写入。我还有一个Excel文档,其中包含我在
扫描
过程中可能遇到
的
所有可能
的
名称(我认为是行,因为没有组合)。有没有办法创建连字(这样Finereader就可以
识别
整行,而不是
把
它分解成单独
的
字符)?我尝试创建用户字典,但Finereader没有将其视为一行。
浏览 3
提问于2017-05-02
得票数 0
1
回答
如何使用doc取器在
PDF
文件中搜索文本?
、
、
我试图在
PDF
文件中找到一些文本,但结果并不准确!举个例子,我有两个
PDF
文件,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件和这个单词。我
的
问题是为什么doc取器没有用这个单词显示另一个
PDF
文件?
PDF
文件之间有什么区别吗?在一个
PDF
中,我只有文本,而其他
PDF
是文本和图像,这是从
扫描
页面。陷阱是什么? P.S.:这两个
PDF
文件位于同一个目录中。
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
1
回答
扫描
PDF
文件并通过php上传
、
如何上传
pdf
文件后,
扫描
通过
扫描
仪馈线?我使用插件将图片上传到服务器,但在我正在开发
的
应用程序中,我必须将
PDF
文档上传到服务器。你能建议我插件或图书馆,即使不是免费
的
,我会非常感谢。
浏览 4
提问于2012-09-17
得票数 0
1
回答
帮助Canon CanoScan LiDE
扫描
PDF
文档
、
、
、
在过去
的
10天里,我刚刚开始使用Ubuntu,打算永久停止使用Windows。到目前为止已经很棒了。我已经用可用
的
Ubuntu应用程序和Google
的
一些帮助替换了几乎所有的Microsoft应用程序。 我
的
佳能CanoScan LiDE 110
扫描
仪出了问题。当我使用Windows 7中
的
扫描
仪,并将
扫描
过
的
书籍页保存为
PDF
格式时,我可以打开
PDF
扫描
页面并直接从其中复制文本以
浏览 0
提问于2014-03-16
得票数 2
回答已采纳
2
回答
buffio.Scanner和文本/
扫描
仪有什么区别?
、
与包和.
的
区别是什么?
浏览 4
提问于2014-08-01
得票数 1
回答已采纳
2
回答
用python打开不带文本
的
pdf
、
我希望为Django视图打开一个
PDF
,但是我
的
PDF
没有文本,python返回给我一个空白
PDF
。在每一页上,这是对一个页面的
扫描
: with open(path) as
pdf
: response = HttpResponse(
pdf
.read(),content_type='applicat
浏览 1
提问于2018-09-17
得票数 0
回答已采纳
1
回答
如何
识别
图像文件中
的
文本,以及如何阅读该文本?
、
、
在图像格式中有满满
的
文字
。(E)以图像文件*.tiff格式
扫描
的
文件。光学字符
识别
方法只
识别
正常格式
的
字母表。在这种图像格式中包含
的
文字
就像行文一样。那么如何
识别
中
的
文本并将其转换为文本文件呢?
浏览 8
提问于2014-10-11
得票数 2
1
回答
无法在Arch Linux上启动
的
语音调度器
、
、
、
、
我在我
的
系统上使用pulseaudio。我已经安装了tts应用程序espeak和flite。这两种方法在从命令行调用时都能很好地工作,但在通过spd-say调用时却无法工作。以下是sudo systemctl status speech-dispatcherd.service
的
输出➜ journalctl -xe Jan 18 00:30:18 archlinux-hostname sudo[1064
浏览 0
提问于2019-01-17
得票数 2
2
回答
汉字
的
C#光学字符
识别
、
、
我正在做一个中
文字
符
的
OCR项目。但问题是,我需要让用户使用方框中
的
光标来选择他们希望系统
扫描
和
识别
字符
的
图像部分。有人知道
怎么
做吗?我被要求做一些像COCR2这样
的
事情。
浏览 1
提问于2011-03-29
得票数 0
2
回答
如何将
pdf
扫描
图像转换为最适合ocr
的
高分辨率tiff?
、
、
我转换
pdf
到tiff图像与图像魔术,从500 to到4.6mb
的
文件大小。convert \pph-psd.tiffTiff图像: 为什么会发生这种情况,以及如何将
pdf
扫描
图像转换为最适合ocr
的
高分辨率tiff?
浏览 1
提问于2018-05-16
得票数 0
回答已采纳
3
回答
如何区分数字创建
的
PDF
和可搜索
的
PDF
?
、
我想知道有多少
PDF
文件属于这三个类别: 这是很容易
识别
图像仅
PDF
在我
的
领域,因为每个<e
浏览 11
提问于2020-08-19
得票数 11
回答已采纳
1
回答
如何在户外阅读图片和
pdf
格式
的
内容
、
、
我想知道如何搜索内容从图像和
PDF
在户外使用光学字符
识别
集成,请让我知道
的
步骤,我可以做到这一点??使用Kofax或EpheSoft
扫描
软件。告诉我步骤..。请帮帮我.. 在进阶时谢谢
浏览 3
提问于2014-08-25
得票数 0
1
回答
ZXing
PDF
417 + ALL_CODE_TYPES
、
、
使用ZXing (在安卓上),如果你启动像这样
的
PDF
417条形码
扫描
.List<String> oDesiredFormats = Arrays.asList("
PDF
_417".split(",")); IntentIntegrator integrator = new你启动一个“所有代码”(除了
PDF
417和其他几个)条形码
扫描
像这样.那么,如何启动一次条形码
扫描
,同时
识别
(所有标准代码和<em
浏览 5
提问于2014-03-21
得票数 2
回答已采纳
1
回答
如何使用python
识别
pdf
中
的
图形?
、
、
、
新
的
pdf
解析。输入-
pdf
与一个图形,如这一个。输出应为-真或假也许还有别的办法? 谢谢!
浏览 5
提问于2022-11-17
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
对PDF进行ocr文字识别怎么操作?扫描识别软件推荐
怎么把扫描的图片变成文字?快速进行文字识别的方法
怎么识别pdf中的文字?这有pdf的文字识别方法
文字怎么识别扫描?教你几招
把图片扫描、识别成文字的操作难不难?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券