腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
复杂
文档
的
OCR
扫描
、
、
、
我需要创建一个工具,将使用高质量
的
相机,以扫描特定
的
文本块从文件和
OCR
他们。每个
文档
都匹配相同
的
模板,其中包含几个填充了数据
的
表。我需要从每个扫描
文档
中提取一个特定单元
的
数据。我需要考虑旋转和轻微
的
图像
转换
。整个工作流应该如下所示:
文档
被“显示”给摄像机。
软件
制作文件
的
图片。
软件
占了一些小
的
旋转和其他
转换</em
浏览 3
提问于2012-04-08
得票数 1
回答已采纳
2
回答
图像-文本
转换
器
、
、
、
我想要一种方法,把书中
的
部分图像
转换
成一个包含数学方程
的
Word
文档
。现在,如果没有开发这样一个
软件
来处理Word中
的
数学方程,那么它至少应该将数学方程作为图片嵌入到Word
文档
中。这种自由
软件
存在吗?最理想
的
情况是Windows,但我也会考虑Linux (请不要使用Mac )。
浏览 0
提问于2015-08-14
得票数 2
1
回答
自动重定向和裁剪相似图像
、
、
、
我已经四处寻找了一段时间,但一直找不到一个人确切地描述我想要实现
的
目标。 目前,我有大约25,000张旧打字
文档
的
图像,我希望从这些图像中建立一个数据库。最初,我认为我只能通过
OCR
软件
在一批中运行这些图像,并处理其中
的
数据。然而,图像
的
格式使我无法使用
OCR
软件
批量
转换
它们,而不会丢失
文档
中
的
大量数据。每张照片中相关信息
的
方向和位置是不同
的
,这
浏览 1
提问于2014-10-04
得票数 0
4
回答
以最快
的
方式批量/批量地将PDF
转换
成可搜索
的
文本?(千)
、
、
、
我想知道是否有人有任何
软件
建议,以大规模
OCR
大约1000个PDF文件。可以;
转换
为文本、word
文档
或使PDF可搜索。我只需要一种高效
的
方法来分析
转换
后
的
文件。我试过Abby FineReader,它不一定能达到我想要
的
速度,所以我想知道是否有更快
的
方法。
编辑
:我基本上是在寻找一种方法,将5000~扫描
的
PDF
转换
为可搜索
的
PDF,甚至是文本文件。
浏览 0
提问于2019-05-06
得票数 0
2
回答
使用PB、EZTWAIN和TOCR 3.0无法识别带有希腊语单词
的
pdf扫描页面
、
Iam使用Dosadi
的
PB 10.5.2和EZTwain 3.30.0.28,XDefs 1.36b1进行扫描。问题是,扫描
的
pdf页面包含拉丁语(对英文字符
的
搜索非常精确,但对希腊语字符
的
搜索则完全不精确。提
浏览 4
提问于2010-04-08
得票数 1
5
回答
OCR
数字格式校正和
转换
、
、
、
、
我正在使用
OCR
包从
文档
中提取货币金额值。有时,小数点会被错误地
OCR
为逗号。
软件
可以进行开箱即用
的
字符替换,但我不能简单地将所有的“,”替换为“”。因为“千位逗号”。该
软件
允许以各种语言编写用于验证和校正值
的
客户脚本。我使用
的
是C#。我已经尝试过不同
的
方法,从子字符串替换,到正则表达式替换,再到全球化和数字样式
的
Double.Parse,等等。你们都有什么建议来实现下面所有的
转换
吗?123.45
浏览 0
提问于2014-08-29
得票数 0
2
回答
OCR
将覆盖HTML传输到图像?
、
我要找一个
OCR
软件
,渲染覆盖HTML到一个图像。我目前正在使用一些未命名
的
产品。它有一个
OCR
功能,可以对带有图像
的
PDF
文档
进行内联
OCR
。内联
OCR
非常方便,它允许搜索带有图像
的
PDF
文档
中
的
文本。也可以直接在
文档
中突出显示文本,
OCR
文本与底层图像对齐。不幸
的
是,我无法从未命名
的
产品中导出或存储内联
OCR</em
浏览 3
提问于2013-05-13
得票数 5
1
回答
将pdf
转换
为txt
、
、
、
我试图将pdf
转换
成
的
文本。基本上,他们有20k+页面的电子邮件打印从Outlook,然后扫描为..pdf。(讨厌,我知道。)我已经尝试过各种工具,比如Tesseract (直接
的
,也包括在用.pdf将.tif
转换
成ImageMagik之后),我只得到了一堆gobbledeegook。 有没有人对如何处理这些文件有其他建议?
浏览 3
提问于2016-02-13
得票数 0
回答已采纳
2
回答
可选择文本
的
PDF查看器
在Ubuntu源代码中有一个很好
的
PDF查看器可以让我选择和复制文本吗?Okular是一个很好
的
应用程序,因为它拥有比Document更多
的
工具。我看到repos有Okular,但我想避免安装它附带
的
所有KDE依赖项。然而,我真正需要做
的
就是从pdf中选择和复制文本。有什么能让我这么做?
浏览 0
提问于2015-12-15
得票数 7
回答已采纳
1
回答
从PDF中获取树
的
文件(最好使用Python)
、
、
、
、
我想制作一系列文件,其中包含了这个PDF ()中
的
树。文件
的
名称将是左边对应
的
树号(t0、t1等)。 我试图使用python提取相关信息和树,但我遇到了麻烦。具体来说,当我尝试将树提取为图像(使用)时,没有出现任何树(大概是因为树不是正确
的
格式)。然而,当我尝试将其全部提取为文本(如)时,树会丢失它们
的
所有格式(以及它们
的
一些信息,我认为)。我怎样才能从这个PDF中获取我想要
的
文件呢?能用Python完成吗?还有更简单
的
方法吗?或者,我获得PDF<em
浏览 0
提问于2018-09-20
得票数 0
回答已采纳
2
回答
什么是最好
的
PHP脚本索引
文档
,执行全文搜索和实现版本控制?
、
、
我需要索引一个很长
的
文档
列表(主要是ms office格式,pdf),并执行全文搜索和支持版本控制。 我读到过关于lucene
的
文章,但它似乎是一个完整
的
解决方案,谁知道一个商业
的
完整索引器?
浏览 0
提问于2012-03-13
得票数 1
1
回答
如何在16.04安装Tesseract
的
新语言包
、
至于后者,最初它出现在我安装
的
软件
列表
的
底部,但现在它似乎已经消失了,尽管还在工作(我想)。 无论如何,我试图将扫描
文档
的
pdf
转换
成可
编辑
的
文本,但是
文档
不是英文
的
,所以gscan把它弄得一团糟。当我去Tools >
OCR
> Language to recognize时,只有选择English、equ和osd。对于如何安装特定
的
语言包,有什么想法吗?我不是一个经验
浏览 0
提问于2016-07-01
得票数 37
回答已采纳
1
回答
关于一个好
的
自由
软件
/网站将pdf
转换
为EPUB
的
建议
、
我发现,当我将一个包含大量文本
的
pdf文件
转换
成EPUB格式(例如书籍)时,它们会在同一句话之间被分割成段落,我使用过-量程,Toepub.com和许多在大坏网站上可以找到
的
网站;-)。我还没有能够完全掌握口径
的
不同
的
features.So,任何黑客修复在口径内
的
转换
也是非常感谢
的
。 我
的
基本问题是文字被歪曲了。段落形成时,甚至连正在进行
的
句子都没有completed.HOW来避免这一点?
浏览 0
提问于2019-11-14
得票数 0
2
回答
从扫描
文档
中提取文本
、
、
有没有方法从扫描
文档
中选择文本?(输出是一个jpg) Ubuntu提供什么样
的
工具来完成这样
的
任务?我是否可以使用任何库来代替构建前
的
软件
二进制文件来做同样
的
事情?我尝试使用Imagemagick将其
转换
为.pdf,然后尝试选择文本,这显然不起作用。
浏览 0
提问于2011-05-10
得票数 10
回答已采纳
5
回答
如何在扫描
的
.jpeg中
编辑
文本?
、
、
、
扫描完
文档
后,我有一个带有小文本
的
.jpeg,在
转换
为PDF进行上传之前,我希望对其进行
编辑
。 我以前从来没有这样做过,所以我真的被困住了。我该怎么做?
浏览 0
提问于2012-12-05
得票数 15
回答已采纳
2
回答
可靠地从扫描
的
文件/图像中提取身份字段?
我试过以下
软件
: 扫描分辨率为我可以将无法正确提取必要信息
的
文档
退回去,但我认为至少会有一半
的
信息被提取出来。我考虑了基于数据库中已知值
的
某种模糊逻辑,但有时这些标识符可以通过单个字符来区别,比如“123 g”和“123 c”。
编辑
:包含
的
应用程序
浏览 2
提问于2009-11-17
得票数 2
3
回答
有没有办法制作一个无法
转换
成word
的
pdf?
、
、
、
我们有一个生成PDF文件
的
系统。但是任何人都可以使用在线pdf to word
转换
器来
转换
这些文件。在Yii或PHP中有什么选项可以阻止这种情况吗?
浏览 0
提问于2016-03-07
得票数 0
1
回答
在GNU/Linux中打开HDMV PGS字幕
、
、
我想知道GNU/Linux中是否有可以读取BluRay字幕
的
软件
。 我说
的
不是像每个人要求
的
那样把
OCR
转换
成SRT,而是阅读它们来查看每一行
的
时间,打开代表每行文字
的
图像。我想读他们
的
内容,而不必播放整个电影,我不在乎能够
编辑
行或
转换
任何其他格式
的
副标题。根据mkvextract
的
说法,扩展应该是.sup,但是当提取带有该扩展名
的
HD
浏览 0
提问于2016-04-21
得票数 4
回答已采纳
1
回答
从PDF获取数据到php/html/javascript
、
、
我想问一下大家对pdf
的
看法。例如,这张图片,这样您就可以看到我想从pdf:输出哪些数据 谢谢
浏览 1
提问于2013-05-08
得票数 0
回答已采纳
11
回答
免费
的
OCR
软件
,使PDF可搜索(与可搜索
的
文本在正确
的
地方)
、
、
、
、
是否有任何免费
的
OCR
软件
(用于Linux和/或Windows)可以像Acrobat那样将PDF扫描
文档
作为输入并输出可搜索
的
PDF?使用可搜索
的
PDF格式,我
的
意思是OCRed文本在原始文本上是不可见
的
,可以用鼠标选择并复制。我知道Linux上
的
gscan2pdf可以这样做,但是文本被放置在页面的左上角,而且太小了,与背景扫描页面上
的
文本完全不同步。这是因为gscan2pdf将整个页面提供给
OCR
浏览 0
提问于2014-04-20
得票数 72
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
今日分享,PDF文档阅读、转换与编辑一体的软件!
云脉OCR文档识别:图片快速转换成电子文档
办公软件PDF文档编辑、转换神器:PDFelement 6 Pro特别版
免费转换文档的软件有哪些?三个免费转换文档的软件推荐
转换pdf文档软件有哪些?四个转换pdf文档软件分享
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券