腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何向只包含图像的
PDF
中添加文本?
、
我使用像富士通iX500 ScanSnap扫描仪这样的硬件解决方案进行实时扫描,同时使用Foxit PhantomPDF向
PDF
中的图像添加文本。这两种解决方案都带来了不错的
OCR
,但是也有一些缺陷,比如在非文本上出现错误,或者99%的文本在页面上被漏掉,因为页面的角落中有3-4个单词与页面上的所有其他文本一样,它们都是90度旋转的。最先进的
OCR
解决方案是将图像转换为可搜索的
PDF
,还是将(隐藏的)文本添加到仅包含图像的现有
PDF
中(添加搜索功能)?
浏览 0
提问于2018-05-25
得票数 0
1
回答
扫描
pdf
至doc
有没有人知道是否有一个
免费
的在线
OCR
转换器,可以转换大扫描的
pdf
文件(例如,我想转换一个扫描的28 of大小的
pdf
文档)? 我试过很多
ocr
转换器,但都失败了。
浏览 0
提问于2016-01-17
得票数 0
3
回答
将
pdf
的内容读取为字符串
、
、
如何将
PDF
的内容以字符串的形式快速读取。我想稍后过滤这个字符串并从中获取特定的文本元素。
PDF
来自一个url,我将它加载到一个web视图中并使用NSURL扩展来缓存它。var urlAsString = String(contentsOfURL: NSURL(string: "http://web.shschools.org/shpid/pdfs/WXS5N48Z.
pdf
, encoding: NSUTF8StringEncoding, error: nil) 但是,我认为这是无
浏览 14
提问于2015-08-02
得票数 0
回答已采纳
1
回答
.NET库,用于将文档扫描到可搜索的
PDF
(带有条形码支持)
、
、
我需要开发一个应用程序,可以扫描文档并生成可搜索的
PDF
,可以从桌面应用程序(例如WPF)或web浏览器预览。还可以从扫描的文档中扫描条形码。要求:生成可搜索的
PDF
(
OCR
) 从扫描文件中扫描条形码。(可选但很好) .NET核心/跨平台支持特塞尔用于
OCR
并生成<em
浏览 0
提问于2020-02-03
得票数 1
11
回答
免费
的
OCR
软件,使
PDF
可搜索(与可搜索的文本在正确的地方)
、
、
、
、
是否有任何
免费
的
OCR
软件(用于Linux和/或Windows)可以像Acrobat那样将
PDF
扫描文档作为输入并输出可搜索的
PDF
?使用可搜索的
PDF
格式,我的意思是OCRed文本在原始文本上是不可见的,可以用鼠标选择并复制。我知道Linux上的gscan2
pdf
可以这样做,但是文本被放置在页面的左上角,而且太小了,与背景扫描页面上的文本完全不同步。这是因为gscan2
pdf
将整个页面提供给
OCR
引擎。它应该将图像分解成小图像,用单行文本或
浏览 0
提问于2014-04-20
得票数 72
回答已采纳
3
回答
如何从
PDF
图像中提取文本
、
、
、
、
我想从有图像的
PDF
中提取数据,图像的形式是字母将在小盒子里,例如name : t e s t,这里的每个单词都将在方形盒子里。下面是示例
浏览 29
提问于2018-05-13
得票数 1
回答已采纳
10
回答
光学字符识别软件推荐?
尤其是那些要么是Ubuntu的,要么是
免费
的?如果那些在Windows上要好得多,请告诉我。我特别感兴趣的那些
OCR
,可以接受一个扫描的
pdf
文件作为输入,但仍然产生作为输出的另一个
pdf
文件看起来与输入一个,但其文本可复制。请每个答案限制一个软件。
浏览 0
提问于2010-10-22
得票数 15
回答已采纳
2
回答
将图像转换为可搜索的
pdf
、
、
、
嗨,我正在寻找一个开源的java API,可以将tiff图像转换为可搜索的
pdf
(
OCR
)。我周围有研究,但到目前为止什么也没有发现。注意:,我看过这篇文章,但是这个API并没有将图像转换成
pdf
。然而,我仍然在玩一些代码。
浏览 6
提问于2012-02-01
得票数 5
1
回答
如何使用C#从扫描的
PDF
文档中提取文本?
、
、
、
该应用程序正在寻找
PDF
文档中的特定模式,并根据该模式将其上传到任何需要的位置。它与
PDF
没有任何问题,
PDF
是用数字方式编写的(Word、Nodepad等)。然后转换成
PDF
格式。我找到了多个第三方库,它们可以处理这个任务-> iText7、LeadTools、ABBYY、WhatsMate
PDF
到text API、SautinSoft .NET Offce Edition。我有一个想法,把
PDF
转换成任何图像类型(jpg,png,tiff等)并使用Tesseract
浏览 18
提问于2021-01-05
得票数 0
1
回答
可以在
PDF
中添加不可见文本层的Windows
免费
OCR
命令行应用程序?
、
、
、
我也看到过其他类似的帖子,但没有一篇有这样的具体要求:Windows本机应用程序可以使用不可见的文本层作为输出创建
PDF
文件。
免费
有人能提供建议吗?我研究过的其他软件接近但不是我想要的: Tesseract (似乎不接受
PDF
输入文件)、OCRmyPDF (只支持Linux/UNIX/macOS )、TrackerSoftware
PDF
-工具(不是
免费
的
浏览 0
提问于2019-08-11
得票数 2
回答已采纳
1
回答
用于windows的
pdf
文档扫描仪
、
我正在寻找一个文件扫描仪为windows 10 (我的表面平板电脑)通过相机转换成多页
pdf
文件文件。类似于天才扫描,但适用于Windows。要求:
免费
广告
免费
或付费(但只付一次!)使用方便很高兴有:自动文档检测可调输出分辨率
浏览 0
提问于2022-09-02
得票数 1
3
回答
通过Windows命令行将TIFF转换为
PDF
、
、
我正在寻找一种
免费
的方式来创建大量的tif文件(10-20k)为
PDF
文件,理想的
OCR
也。 它需要从windows中的命令行调用。
浏览 3
提问于2011-03-01
得票数 8
回答已采纳
4
回答
一种基于
OCR
的
PDF
文本提取方法
、
、
是否有人尝试过使用
OCR
库和Java从
PDF
中提取文本?你认为什么是最可靠的文本提取库?我见过的大多数方法(tesseract、GOCR)都是C库,需要编写一些JNI代码。
浏览 2
提问于2009-04-22
得票数 6
3
回答
快速在线
OCR
工具
、
我的一个同事刚发了一份他正在写的东西的草稿.作为一种形象!我如何快速地将其转换成实际文本,而不需要安装任何东西、注册或等待数小时?
浏览 0
提问于2014-02-06
得票数 7
回答已采纳
2
回答
在WinForm中寻找
OCR
库
、
、
是否有任何
免费
/付费的
OCR
库能够捕获
PDF
格式的发票数据?需要有一个低的错误率。我们需要对这些数据进行进一步的处理。
浏览 0
提问于2019-06-10
得票数 1
1
回答
用于Windows的
PDF
文件和图像(
OCR
)文本识别应用程序
、
、
、
问题:
PDF
文件和扫描文件中的图像包含无法复制或编辑的文本。但是,由于文档的大小和所涉及的大量时间,手工打字是不可能的。重量轻,使用简单文本可以保存在新的可编辑
PDF
或RTF文档中。 开源或高级版
浏览 0
提问于2019-12-05
得票数 1
1
回答
用于搜索
pdf
中关键字并给出页码的宏
、
我想要一个excel宏,它可以在
PDF
中搜索单词,并给出宏找到单词的页码。我有20个单词,我想在
PDF
中搜索。
浏览 2
提问于2018-06-21
得票数 0
3
回答
Tika/PDFBox的替代方案,用于在Solr中解析
PDF
(1.4以后的任何版本)
、
、
、
、
似乎Solr没有正确解析我的
PDF
文件。我想知道有没有其他方法可以替代Apache Tika (我相信它在内部使用PDFBox )来解析
PDF
文件?我已经通过PDFBox (最新版本)直接运行
PDF
来隔离问题,这也有同样的问题。一些
OCR
商业软件,如Omnifind,在
PDF
上工作很好,但我们不能以同样的方式将它们与Solr集成,购买也不是一个选择。
浏览 13
提问于2011-11-16
得票数 5
回答已采纳
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件进行批处理,更多
、
、
、
、
我使用ScanSnap S1500M将所有纸质文档扫描到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 我应该用自动售货
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
4
回答
哪些工具可以在Mac上将扫描过的纸张文件转换成可搜索的文本
pdf
?
、
、
、
、
我需要将扫描文档转换为mac上可搜索的文本
PDF
。它不需要
免费
,只需要比Acrobat更低的成本。
浏览 0
提问于2015-03-02
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
[windows] Umi-OCR 免费 · 离线 · 文字识别软件 支持PDF识别 开源
在线Ai免费文字识别 OCR
PDF怎么用OCR来识别文字,这个人工智能OCR工具绝了
通用 PDF OCR 到 Word API 数据接口
OCR图片转文字软件Umi-OCR,图片文字识别离线版软件,免费开源
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券