腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
HowTo从PDF中提取嵌入的光学字符识别数据?
、
、
、
我有嵌入
OCR
数据的PDF
文件
。(所以我已经对它们进行了orcd ),所以它们是
可
搜索的。现在我想提取这个
OCR
数据,因为我想放入我的tomcat6搜索服务器。为此,我需要普通的
OCR
数据。所以我的问题是,有没有可能从pdf
文件
中提取嵌入的
OCR
数据?如果能得到带有坐标的
文件
就好了。但它也足以获得纯文本
文件
。
浏览 2
提问于2011-03-02
得票数 2
1
回答
用c#编程
编辑
PDF (非固定PDF)
、
、
、
、
是否可以
编辑
在C#中不可填充的PDF格式 所需经费: 必须
编辑
以编程方式填写的表格中的文本和数据,并保存它。
浏览 6
提问于2012-06-28
得票数 1
4
回答
以最快的方式批量/批量地将PDF转换成
可
搜索的文本?(千)
、
、
、
我想知道是否有人有任何软件建议,以大规模
OCR
大约1000个PDF
文件
。可以;转换为文本、word文档或使PDF
可
搜索。我只需要一种高效的方法来分析转换后的
文件
。
编辑
:我基本上是在寻找一种方法,将5000~扫描的PDF转换为
可
搜索的PDF,甚至是文本
文件
。
浏览 0
提问于2019-05-06
得票数 0
2
回答
如何
编辑
可
搜索PDF的搜索文本?
、
我的mac上也有几个应用程序,可以从扫描文档或原始图像创建这种
可
搜索的PDF。现在,任何使用过
OCR
的人都很明显,将图像转换为文本的过程并不是100%准确的,所以在某些地方搜索或复制的文本是不正确的。因此,我搜索了相当一段时间来找到一个应用程序,它可以加载
可
搜索的PDF,并允许我修复隐藏的
可
搜索文本,而无需重新格式化或修改原始扫描图像。 有人知道有一个工具(或库API)允许这样做吗?值得一提的是,我尝试了Acrobat的最新版本,但它似乎不允许我查看隐藏的
可
搜索文本,更不用说
编辑
它了。它
浏览 6
提问于2015-10-02
得票数 1
11
回答
免费的
OCR
软件,使PDF
可
搜索(与
可
搜索的文本在正确的地方)
、
、
、
、
是否有任何免费的
OCR
软件(用于Linux和/或Windows)可以像Acrobat那样将PDF扫描文档作为输入并输出
可
搜索的PDF?使用
可
搜索的PDF格式,我的意思是OCRed文本在原始文本上是不可见的,可以用鼠标选择并复制。这是因为gscan2pdf将整个页面提供给
OCR
引擎。它应该将图像分解成小图像,用单行文本或小段落发送到
OCR
软件。
浏览 0
提问于2014-04-20
得票数 72
回答已采纳
1
回答
如何使用Google的Vision API将PDF (不可搜索的)转换为
可
搜索的PDF?
、
、
、
据我所见,Google的Vision API允许您在PDF上执行
OCR
,但它只返回JSON格式的检测到的文本。我需要的是一个
可
搜索(
OCR
的) PDF
文件
作为回报。这个是可能的吗?
浏览 4
提问于2020-07-26
得票数 3
回答已采纳
1
回答
从
可
搜索的pdf中读取,不带
ocr
我目前正在使用扫描仪将我的PDF转换为
可
搜索的PDF。
OCR
已经处理好了,因为我可以在PDF中使用ctrl-f。 但是,我如何才能从我的程序中获取
OCR
的内容。是否可以通过读取
文件
来公开访问
OCR
文本?
浏览 1
提问于2011-12-15
得票数 0
1
回答
Tesseract 3.02.02坠毁JRE
、
、
、
我们正在使用Tess4J/Tesseract在webapp上执行
OCR
。我们被读取多个
文件
(不同的
文件
) simultaneously.if,我们运行
OCR
,它运行大约1分钟后,它通过致命的错误。你能建议怎么解决吗?0x22cf90] tesseract::HistogramRect(unsigned char const*, int, int, int, int, int, int, int*)+0x70 写核心
转
储失败核心
转
储已被禁用。若要启用核心
转
储,请
浏览 0
提问于2017-03-28
得票数 1
2
回答
如何修复nodejs的错误找不到模块
、
、
我在一个.js
文件
中创建了一个函数,我试图在一个应用程序构建的get路径中导入和使用这个函数,但是我一直在收到这个错误 throw/crawler/
ocr
-crawler.js'async function OcrCrawlerTest(){ } module.exports/crawler/
ocr
-c
浏览 5
提问于2021-05-29
得票数 0
回答已采纳
2
回答
‘`tesseract cri`可以将结果放到STDOUT中吗?
使用tesseract-
ocr
#3.02.02。tesseract sourc.png result是否有将结果
转
储到stdout中的选项?
浏览 0
提问于2014-06-22
得票数 24
回答已采纳
2
回答
GCP
OCR
服务-将扫描的PDF或图像转换为
可
搜索的PDF
、
是否可以使用Google平台的
OCR
将扫描的PDF转换为新的
可
搜索PDF
文件
?
浏览 2
提问于2018-01-24
得票数 0
2
回答
是否有将我的图像/文档标准化为PDF的.NET库?
、
、
我需要一个工具或库,将摄取该
文件
和执行
OCR
,如果必要,但保存作为一个标准化的PDF
文件
存档的目的(PDF/A)。是否有一个工具或.NET库可以实现这一点?如果文档已经
可
搜索,则不应再次使用
OCR
。
浏览 0
提问于2021-02-22
得票数 2
1
回答
OCR
在字幕
编辑
中的应用
当我在windows版本的字幕
编辑
中使用内置的
OCR
实用程序将.PGS字幕转换为.SRT格式时,我使用字幕
编辑
,但看起来Ubuntu版的字幕
编辑
没有这种功能.或者它是否需要安装其他元素才能工作?还有人在Ubuntu (16.04到17.10)中使用字幕
编辑
(16.04到17.10),并且知道是否有一种方法可以“打开”它的
OCR
功能,就像在windows中一样?
浏览 0
提问于2018-03-31
得票数 2
2
回答
为什么我用魔杖从pdf中提取图像jpg,它会在文本上变成黑色背景?
、
、
、
、
我对一些pdf
文件
有问题。我需要将它们转换为jpg图像,使它们可用于
OCR
,但当我转换其中的一些,魔杖
转
我的jpg在那里有一个黑色的背景文本。我看到这是一个关于空间颜色的常见问题。这似乎发生在word转换为pdf
文件
的
文件
中,其中空间颜色变成了CMYK。Tesseract
OCR
仅接受空间颜色RGB。我已经写了一个可以转换的python脚本,但我想解决这个问题。你能帮我一下吗?
浏览 51
提问于2019-04-22
得票数 1
回答已采纳
3
回答
用
OCR
、
、
如何使用任何java库生成
可
搜索的文本?开源或付费。 如何使用PDFBox将
OCR
应用于pdf?如何使pdf文本可编程搜索使用pdfbox,我搜索了很多。没有找到任何解决办法。有人能粘贴
OCR
PDFBox的代码吗?
浏览 8
提问于2014-04-04
得票数 0
回答已采纳
1
回答
将扫描的pdf转换为R中
可
搜索的pdf
、
我有一个pdf,大约50页扫描表。我需要最终把它刮到R中,这样我就可以清理数据并将其导出为.csv。我有使用tabulizer抓取可读的pdfs的经验,但我以前从未真正使用过扫描pdfs,tabulizer无法读取它们。有没有一种方法可以将扫描的pdf转换成可读的pdf,这样我就可以在tabulizer中抓取它了?还是另一种将扫描的pdfs抓取到表中的方法?
浏览 5
提问于2022-11-16
得票数 0
4
回答
如何在Google查看器中选择扫描文档中的文本
、
、
、
OCR
似乎是通过Google来实现的,因为我可以通过它中的单词搜索和查找扫描文档。还有其他人可以这样选择文本吗?多么? 什么是解决办法与最小的鼠标点击每扫描来选择文本从它?
浏览 0
提问于2015-01-26
得票数 11
回答已采纳
4
回答
从扫描创建copy+pastable PDF
、
、
我有PDF
文件
,这是从扫描仪创建的。PDF只包含图像。
OCR
:从图像中读取文本一页的处理时间不应超过20秒。 命令行和/或API,不需要GUI。
浏览 0
提问于2018-06-05
得票数 1
1
回答
文件
和收据管理(替代整洁收款机)
、
、
多年来,我一直在使用整洁来扫描和整理我的收据、账单、税务
文件
,几乎所有可以放在
文件
柜里的东西。几天前,我发现他们将停止对桌面版本的支持,并试图把每个人都推向我不感兴趣的基于订阅的云服务。基本上,我正在寻找某种数字
文件
柜,
文件
可以组织在其中。关键字搜索,所有文档在扫描时都是
OCR
编辑
的,来自收据的相关信息将自动添加到数据库供应商、成本、税收等。 对于Windows 10。
浏览 0
提问于2016-04-08
得票数 5
2
回答
带有
OCR
的PDF阅读器
、
、
因此,也许一个PDF阅读器与一些内置的
OCR
功能可能会有所帮助。
浏览 0
提问于2016-02-29
得票数 4
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pdf转ppt,怎么把pdf文件转换成可以进行编辑的ppt文件
怎么编辑pdf格式的文件?除了转word,还可以直接修改pdf
怎么才能把pdf文件转换成可修改、编辑的excel表格?
PDF文件压缩+转格式,三分钟搞定,让文档轻松可编辑
pdf转word最简单方法是什么?教你简单转换
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券