腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
可将OCR文本插入回源
PDF
的
OCR库
pdf
、
ocr
是否有库(或可执行文件)可以OCR
PDF
(通常是通过
扫描
纸张创建
的
PDF
),并将
识别
出
的
文本重新注入到
PDF
中?很可能是
扫描
图像背后
的
隐形
文字
。 最好是开源
的
。(目标:我有一个巨大
的
由Lucene索引
的
PDF
文件库。如果
PDF
包含文本,Lucene将更容易找到哪些
PDF
是相关
的
。)
浏览 3
提问于2011-02-28
得票数 2
1
回答
关于拆分
PDF
和OCR
识别
python
、
pdf
、
split
、
ocr
我有很多
pdf
文档,它们都是
扫描
过
的
文字
版本。我需要在
pdf
中拆分一个页面。 例如,如果有1个页面。我需要将一页分成页眉部分,页脚部分,主体部分和侧面部分。哪种编程语言和库给了我最大
的
灵活性来完成这样
的
任务,而不需要我做所有繁琐
的
工作。我对Python很熟悉。我知道Python
的
PDF
和OCR库,但我找不到任何关于拆分单个页面的内容。然后,最后希望将
pdf
页面的拆分部分传递给OCR,以
识别<
浏览 18
提问于2021-04-20
得票数 0
回答已采纳
1
回答
如何使用doc取器在
PDF
文件中搜索文本?
pdf
、
search
、
text
我试图在
PDF
文件中找到一些文本,但结果并不准确!举个例子,我有两个
PDF
文件,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件和这个单词。我
的
问题是为什么doc取器没有用这个单词显示另一个
PDF
文件?
PDF
文件之间有什么区别吗?在一个
PDF
中,我只有文本,而其他
PDF
是文本和图像,这是从
扫描
页面。陷阱是什么? P.S.:这两个
PDF
文件位于同一个目录中。
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
1
回答
帮助Canon CanoScan LiDE
扫描
PDF
文档
pdf
、
canon
、
scanner
、
ocr
在过去
的
10天里,我刚刚开始使用Ubuntu,打算永久停止使用Windows。到目前为止已经很棒了。我已经用可用
的
Ubuntu应用程序和Google
的
一些帮助替换了几乎所有的Microsoft应用程序。 我
的
佳能CanoScan LiDE 110
扫描
仪出了问题。当我使用Windows 7中
的
扫描
仪,并将
扫描
过
的
书籍页保存为
PDF
格式时,我可以打开
PDF
扫描
页面并直接从其中复制文本以
浏览 0
提问于2014-03-16
得票数 2
回答已采纳
2
回答
buffio.Scanner和文本/
扫描
仪有什么区别?
io
、
go
与包和.
的
区别是什么?
浏览 4
提问于2014-08-01
得票数 1
回答已采纳
1
回答
如何
识别
图像文件中
的
文本,以及如何阅读该文本?
java
、
algorithm
、
ocr
在图像格式中有满满
的
文字
。(E)以图像文件*.tiff格式
扫描
的
文件。光学字符
识别
方法只
识别
正常格式
的
字母表。在这种图像格式中包含
的
文字
就像行文一样。那么如何
识别
中
的
文本并将其转换为文本文件呢?
浏览 8
提问于2014-10-11
得票数 2
2
回答
如何将
pdf
扫描
图像转换为最适合ocr
的
高分辨率tiff?
pdf
、
imagemagick
、
tiff
我转换
pdf
到tiff图像与图像魔术,从500 to到4.6mb
的
文件大小。convert \pph-psd.tiffTiff图像: 为什么会发生这种情况,以及如何将
pdf
扫描
图像转换为最适合ocr
的
高分辨率tiff?
浏览 1
提问于2018-05-16
得票数 0
回答已采纳
1
回答
ZXing
PDF
417 + ALL_CODE_TYPES
android
、
zxing
、
pdf417
使用ZXing (在安卓上),如果你启动像这样
的
PDF
417条形码
扫描
.List<String> oDesiredFormats = Arrays.asList("
PDF
_417".split(",")); IntentIntegrator integrator = new你启动一个“所有代码”(除了
PDF
417和其他几个)条形码
扫描
像这样.那么,如何启动一次条形码
扫描
,同时
识别
(所有标准代码和<em
浏览 5
提问于2014-03-21
得票数 2
回答已采纳
1
回答
如何使用python
识别
pdf
中
的
图形?
pdf
、
text-parsing
、
pdf-parsing
、
pdfplumber
新
的
pdf
解析。输入-
pdf
与一个图形,如这一个。输出应为-真或假也许还有别的办法? 谢谢!
浏览 5
提问于2022-11-17
得票数 0
1
回答
在图像中查找已知文本(引导OCR)
image-processing
、
ocr
我在寻找一种在图像中定位已知文本
的
方法。 具体来说,我正在创建一个工具,将一组
扫描
页面转换为支持搜索和copy+paste
的
PDF
。我理解这通常是如何做到
的
: OCR页面,保留文本
的
位置,然后将文本作为不可见层添加到
PDF
中。Acrobat具有此功能,tesseract可以输出hOCR文件(包含
识别
的文本及其位置),hocr2
pdf
可以使用这些文件生成文本层。不幸
的
是,我
的
源图像质量相当低(最多15
浏览 3
提问于2015-02-23
得票数 4
0
回答
.net
的
tesseract OCR能处理
pdf
文件吗?
c#
、
pdf
、
ocr
、
tesseract
我想在png和
pdf
文件上执行光符
识别
。我能够获得png文件
的
Tesseract 3.0.2 .net包装器工作,但我找不到任何用于
PDf
files.So
的
类,它是否适用于
pdf
files.If不然后请让我知道
扫描
pdf
的
任何其他开源库。我
的
需求是
扫描
特定圆
的
pdf
格式
的
图表,并为这些圆创建超链接。
浏览 8
提问于2016-12-27
得票数 2
回答已采纳
1
回答
如何从
PDF
文件中正确提取日文txt
python
、
algorithm
我需要从
pdf
文件中提取文本。谁能给我一个如何处理
的
提示?
浏览 5
提问于2022-02-22
得票数 1
回答已采纳
1
回答
使用从
扫描
PDF
批量生成
的
OCR创建可搜索
的
PDF
文件
pdf
、
ocr
其目标是自动将所有
扫描
文档转换为可搜索
的
PDF
文件,而不仅仅是图像。
扫描
后
的
文档由
扫描
仪自动上传到Linux服务器上
的
共享文件中,作为
PDF
文件。该软件应该能够监视文件夹和自动OCR
扫描
的
文件,并将
识别
的文本添加到
PDF
文件,使其可搜索。它还应该能够很好地处理多页
PDF
。Linux 在后台自动工作,不需要任何额外
的
手动步骤。能够以正确<
浏览 0
提问于2014-04-28
得票数 16
1
回答
在OSX中为
扫描
手写便笺
的
PDF
添加文本层
macos
、
pdf
、
handwriting
在课堂上,我喜欢手写
的
笔记,然后我
扫描
它们,然后把它们打出来(帮助我记住它们,也使它们易于搜索)。主要
的
问题是,我使用了大量
的
绘图和复杂
的
数学,将数学公式转换成胶乳(或word)非常耗时,绘图要求我保存
PDF
和文本文档。我想做
的
是把我自己输入
的
基本文本(没有OCR)添加到
PDF
的
文本层中,这样
PDF
就可以搜索,并且我可以通过不转换数学或绘图来节省很多时间。我已经研究过Preview、PDFpenPr
浏览 9
提问于2013-09-12
得票数 2
2
回答
使用Google Cloud Vision
的
OCR
PDF
文件?
pdf
、
pdf-generation
、
ocr
、
google-cloud-vision
目前是否有任何服务或软件工具使用Google Cloud Vision作为OCRing
扫描
的
PDF
文件
的
后端?如果没有,如何使用Google Cloud Vision将
PDF
转换为OCRed
PDF
?据我所知,Cloud Vision目前支持
PDF
文件,但它只能将
识别
的文本输出为JSON文件。因此,似乎需要在Google Cloud Vision之外
的
另一个步骤中,将这个转换后
的
文本放在
PDF
中<e
浏览 0
提问于2018-09-15
得票数 4
1
回答
如何创建高保真度
PDF
与可复制文本
扫描
?
pdf
、
scanner
、
text
、
ocr
一些公司通过
扫描
仪提供Windows软件,这些软件可以从
扫描
过
的
页面上创建
PDF
,这些页面看起来与
扫描
的
内容完全一样(就好像它只是全页图像),但文本是可以
识别
和复制
的
。如何在Ubuntu上创建这样
的
PDF
? 请注意,我不希望将
扫描
文本转换为常规文本。我想保持
PDF
外观
的
图片-完美的原始页面,但增加了一个公认
的
文本层,以方便使用。我有一个工作<em
浏览 0
提问于2017-09-24
得票数 4
回答已采纳
1
回答
寻找收据
扫描
器,而不是连续
扫描
任何长度
的
收据。
scanner
我正在寻找一个收据
扫描
仪,可以
扫描
非常长
的
收据(高达30英尺长),并产生一个单一
的
图像或
PDF
。理想情况下,它将具有光学字符
识别
(optical字符
识别
),并生成一个包含文本信息
的
PDF
(例如,当您在Acrobat之类
的
地方打开
PDF
时,您可以搜索单词,或者可以使用单独
的
软件将文本内容提取到一个因为我不希望它用于像Neat这样
的
软件,所以如果可能的话,我不愿意为
浏览 0
提问于2018-05-09
得票数 2
1
回答
如何快速从图像中
扫描
可搜索
的
pdf
?
ios
、
swift
、
pdf
、
ocr
、
swift5
我想
扫描
文件与tesseract框架中
的
迅速和生成
pdf
文件,可以搜索。 var str = "0" if let tessaract
浏览 2
提问于2020-10-13
得票数 0
回答已采纳
2
回答
Acrobat XI Pro喜欢
pdf
阅读器
application-development
、
pdf
、
adobe-reader
我如何安装一个
PDF
阅读器,像“杂技XI专业”,让我突出文本,有
文字
识别
,让我组合和转换
PDF
格式和其他格式?
浏览 0
提问于2015-02-02
得票数 0
2
回答
如何确定是否
扫描
了.
pdf
文件
的
内容
php
、
zend-framework
、
zend-pdf
因此,我有一个.
pdf
文件,我需要能够确定它是否是通过
扫描
到
PDF
中创建
的
。我正在尝试确定它是否是我可以显示为文本
的
pdf
。$
pdf
->properties['Producer']有没有办法确定我处理
的
是哪种类型
的
.
pdf
文件?
浏览 6
提问于2010-03-05
得票数 3
回答已采纳
点击加载更多
相关
资讯
对PDF进行ocr文字识别怎么操作?扫描识别软件推荐
怎么识别pdf中的文字?这有pdf的文字识别方法
文字识别/图片识别/图片扫描
文字识别扫描,快速简单的扫描软件
看完这几个文字识别扫描方法,就知道怎么进行文字识别扫描了
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券