腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(5343)
视频
沙龙
5
回答
在windows XP上运行的开源
OCR
库
我在找在windows XP上运行的开放源码的
OCR
库。我需要这为图像和PDF的工作。大多数情况下,我想从java接口这个库。你知道有没有可用的东西? 致以问候。
浏览 13
提问于2013-04-24
得票数 0
2
回答
图像到文本-移除python 2.7中的非ascii字符
、
、
、
、
我正在使用pytesser对
OCR
进行
OCR
,并从中获取一个字符串:text = image_to_string(image)有什么办法使它不返回任何非ascii字符?也许您可以在tesseract
OCR
中改变什么?或者,有什么方法可以测试字符串中的非ascii字符(而
不
破坏程序),然后不打印这一行?
浏览 5
提问于2014-07-24
得票数 3
回答已采纳
1
回答
CSS属性选择器未选择
、
我有一个问题,但不知道是否有答案,因为似乎没有人知道。我在一个网页上有几个div,它们的类名以-modal结尾,我使用CSS选择器选择它们这是一种享受。我还有三个以-window结尾的div (.one-window、.two-window等),我尝试用以下命令选择它们我什么也得不到。如果我使用传统的 .one-window, .two-windo
浏览 6
提问于2014-03-18
得票数 3
2
回答
如何基于条件过滤掉数据
、
、
、
、
我需要另一份志愿者名单,其中包括他们的信息,只要他们不是被
选中
为
不
活跃。如果他们现在正在联系,
以后
再联系,新的注册,甚至没有数据.如果它说
不
活跃,我
不
希望它们
出现
在我的第二个工作表中。就这样。
浏览 0
提问于2019-08-23
得票数 0
回答已采纳
6
回答
关于在黑板图像上使用
OCR
的建议
、
、
、
、
我正在试着得到一张
OCR
可读的黑板图像。当然,大多数
OCR
软件不喜欢肮脏的图像。我应该尝试通过什么图像处理来清理图像?
浏览 3
提问于2010-05-18
得票数 1
回答已采纳
1
回答
我还能用什么其他诊断方法来解决这个特殊的Perl问题呢?
、
我还尝试使用Microsfot文档成像来测试我正在试验的TIF是否是文本可识
别的
,并且结果是肯定的。提前谢谢。哈哈,我终于弄明白问题在哪里了,怎么解决的。当我试图回复你的评论时,我添加了网址的链接,然后再看一看那里的
内容
。,OCRed文本
出现
在屏幕上。
OCR
结果令人满意。 现在,我认为我的Office2007OCRAPI有点奇怪,如果有人碰巧运行了Wi
浏览 6
提问于2010-03-02
得票数 3
1
回答
从Tika使用Tesseract :结果只包含换行符
、
尽管从命令行运行Tesseract可以正确识别文本,但Tika返回的
内容
仅包含换行符("\n")。TesseractOCRConfig config = new TesseractOCRConfig();config.setTessdataPath("C:\\Program Files (x86)\\Tesseract-
OCR
\\tessdata"
浏览 17
提问于2017-03-09
得票数 0
5
回答
找一种工具:通过这个工具扫描一张发票,可以把这张发票的信息提取出来,在腾讯云上是否有这种工具?
浏览 9947
提问于2017-09-22
3
回答
更改windows批处理中的文件扩展名
、
、
、
到目前为止,我只想将扩展从".pdf.
OCR
.pdf“更改为".pdf”,我得到了以下代码 rem for /r myPDFfolder %%i in (*.pdf.
OCR
.pdf) do ren "%
浏览 5
提问于2015-08-27
得票数 1
回答已采纳
2
回答
在PDF文件中自动粗体显示整个文本
、
我收到了一组大的pdf文件(每个文件> 1000页),我想在这些文件中“自动”粗体显示整个文本(以便
以后
执行
OCR
过程)。 我可以通过手动、一页一页地完成这项任务。
浏览 1
提问于2017-10-10
得票数 0
1
回答
模糊推理,文本处理,词汇分析?
、
、
这些文件是
OCR
用来发短信的。 胡扯 垃圾短信..。问题是,由于文本是
OCR
输出,偶尔会
出现
一些奇怪的替换,比如'2‘-> 'Z’,这使得普通正则表达式毫无用处。我已经尝试过Levenshtein模块,它很有帮助,但是它需要事先知道编辑距离是多少。还有
别的
吗?这使我走上了各种有趣但不相关的道路。如能提供指导,将不胜感激。哦,而且,文本一般都是来自特定的技术领域,所以一
浏览 1
提问于2012-05-27
得票数 3
1
回答
如何在TIFF图像上覆盖文本,创建类似于可搜索pdf的
内容
?
、
、
如果"foo“和"bar”
出现
在页面上。并且在只包含"foo“的图像上进行了选择,那么我只想选择单词"foo”。 是否有一种格式可以同时存储文本的位置和图像的文本?
浏览 10
提问于2011-06-17
得票数 0
回答已采纳
1
回答
在调试模式中使用Polly
、
、
在调试模式下使用Polly (如果
出现
异常抛出)时,Visual在第一次尝试时会进入调试模式。我预计只有在上次尝试之后才会抛出异常。有什么办法改变这种行为吗?
浏览 1
提问于2015-08-10
得票数 1
回答已采纳
1
回答
以编程方式获取nUnit选定的类别
、
是否有一种在执行测试时以编程方式获取所选测试类
别的
方法?如果类别未被
选中
,Im试图找到一种让testCaseSources
不
返回任何
内容
的方法
浏览 1
提问于2012-06-13
得票数 6
1
回答
矢量图形中文本的定位与识别(DXF、SVG、WMF等)没有
OCR
?
、
、
OCR
对我的
内容
没有很好的效果,因为( a)它是矢量格式的,需要从它生成栅格图像,并且在新闻部需要的时候非常非常大;( b)文本稀疏(分布在很大的区域),不
出现
在文本行中,而且经常是旋转或镜像的。这似乎应该是一个类似于手写识
别的
问题,只不过它是在大的坐标空间(即一次没有一个字母或单词)上操作的,绘图中也有大量的非字符数据。 我发现对这类问题的研究很少,甚至更少的代码。
浏览 1
提问于2012-07-12
得票数 1
2
回答
fts文档级索引,获取页面级
别的
结果(以dtSearch为例)
、
、
我们用
OCR
-他们,全文索引他们和执行搜索。
浏览 3
提问于2012-05-21
得票数 2
1
回答
从悬停到单击的CSS选定状态
、
、
、
、
在我的网站上,我使用了一个导航栏,这个导航栏是我很久以前从一个有许多免费罐装导航栏的网站上拉出来的,从那
以后
,我只需修改参数,就可以对其进行很大的修改。现在,随着移动端的
出现
(是的,我落后了),我想把我所有的下拉菜单从悬停时弹出改为点击时弹出。我知道bootstrap就是这样做的,等等,所以很明显它是可以做到的。对我来说,事物开始改变颜色,并基于这样的东西
出现
: .menu ul li.selected a.outer1 {color:#000; background:#929292; margin-bottom,
内容
会发
浏览 7
提问于2012-12-14
得票数 0
1
回答
TortoiseHg:为什么我总是需要检查“丢弃本地更改,没有备份”来更新工作目录?
、
、
、
、
我刚刚提取了所有传入的更改,提交了所有
内容
,甚至按下了所有提交,即使这样,如果
不
选中
“丢弃本地更改,没有备份”复选框,则更新按钮在Update工作目录窗口中也会变灰。这个复选框是否总是被
选中
是正常的吗?如果不是,那为什么在我的TortoiseHg中会
出现
这种情况呢?
浏览 3
提问于2014-09-05
得票数 1
回答已采纳
2
回答
使用jQuery验证ASP.Net中的单选按钮
、
、
attr('checked'); 在使用验证器调用触发函数时,它会弹出一个窗口,其中包含 “未定义未定义”,即使
选中
无线电时也是如此
浏览 14
提问于2010-12-09
得票数 0
回答已采纳
1
回答
如何将tesseract配置更改为识别§并在R中应用pdftools::pdf_
ocr
_text?
、
、
、
digits文件
内容
如下:如何将§添加到要以正确方式识
别的
字符列表中,以使其适用?我首先将扫描的PDF文件转换为图像,然后使用以下
内容
:它创建了fileToText.txt。它确实能识别§。所有这些都是正确识
别的
。但德文货币没有被正确识别,因
浏览 10
提问于2020-12-01
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
图片上的文字有哪些方法可以将其提取出来?这几招试试看
ocr识别表格怎么识别?选用这个方法好!
怎么识别图片文字转化为文本?这个方法需要拿捏
升级OCR引擎,讯飞输入法v9.1成为扫描输入新神器
云脉文档识别:省时省力错漏少
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券