腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
2
回答
Tessaract OCR是否使用神经网络作为它们的默认训练机制?
、
、
、
抱歉,这可能是个愚蠢的问题。但我对机器学习和Tessaract OCR相当陌生。我听说Tessaract OCR是可以训练的。 我需要知道的是,Tessaract OCR是使用神经网络作为它们的默认训练机制,还是我们必须明确地编程才能使用神经网络? 如果我对这个“训练”概念想错了,很抱歉。但我需要确切知道的是,Tessaract已经使用了NN,如果不是,我如何使用NN和tessaract OCR来提高识别精度? 如果有人能建议我一些好的资源/方法来参考/尝试和开始,这也是一个很大的帮助。 我目前所知道的基本机器学习,监督训练的概念,并执行基本的图像OCR操作在Tessaract OCR。
浏览 3
提问于2015-04-10
得票数 12
回答已采纳
1
回答
同步文本和音频。有没有NLP/语音到文本库来做这件事?
、
、
我想要同步语音录音与已知的文本。是否有一个语音到文本/自然语言处理库可以促进这一点?我想我会想要检测单词边界并从字典中计算候选匹配。我发现的大部分问题都与书面语言有关。 所需但不需要的: 开放源码 兼容美式英语开箱即用 跨平台 全面记录 编辑:我意识到这是一个非常广泛,甚至天真的问题,所以提前感谢你的指导。 我到目前为止发现的是: (iOS狮身人面像/Flite包装)
浏览 1
提问于2010-11-01
得票数 14
回答已采纳
1
回答
什么最适合车牌字符识别?是OCR还是ANN?
、
、
我是一名大四的大学生,我正在做一个车牌识别系统作为我的大四项目。我想知道当识别最适合的字符时,是人工神经网络(ANN)还是使用模式匹配的光学字符识别(OCR)?或者有什么简单的方法可以使用吗?所有的回答都表示欢迎。 非常感谢
浏览 1
提问于2010-08-18
得票数 0
回答已采纳
1
回答
如何在列表控件中使用checkbox
、
、
嗨,我一直在做我的最后一个项目关于识别系统的IMEI号码。我使用c++MFC,我得到了MySQL中的数据库列表控制和设置复选框的LVS_EX_CHECKBOXES。如果编辑控件中的数字像listcontrol中的imei一样,我会将图片OCR到所有编号。让程序在空白处交叉。 it镜像项目帮助指导我,谢谢。
浏览 4
提问于2014-01-19
得票数 0
1
回答
使用IronOCR Tesseract在C#中读取图像中的文本
、
、
根据这个Link,我安装了IronOcr包,并尝试了以下代码。 using IronOcr; var Result = new IronTesseract().Read(path); string currentSubText = Result.Text; textBox1.Text += currentSubText + Environment.NewLine + Environment.NewLine; 我用六张图片进行了测试: 图片 ? 图片 ? 图片 ? 图片 ? 我可以上传四张照片。 实际上它看起来不错。只有几个错误与一些特殊的德语字符(äöü) 结果1: ?
浏览 309
提问于2021-09-06
得票数 1
1
回答
如何将图像OCR用于视频?
、
、
、
目前我正在开发自动车牌识别系统。我已经使用yolov7的号码板检测和文本检测设施,从谷歌视觉API。我用测试图像测试了整个系统。现在我愿意开发一个系统来检测和读取视频源中的车牌。我可以为视频做检测部分,而我被卡住的地方是使用OCR作为视频中检测到的绑定框。 对于图像,我首先应用经过训练的YOLOv7模型,提取出车牌,并将检测到的车牌保存为从目录中的原始图像中裁剪出来的部分。然后将OCR应用于该裁剪部件(号码板),并读取文本。 测试样本: NP检测: 检测到的NP:(OCR应用于这幅裁剪的图像) 检测到的文本: 我可以从视频中检测到车牌号码,但无法找到一种方法来冻结检测到号码板的帧,
浏览 9
提问于2022-09-13
得票数 1
1
回答
Google Cloud Vision API在线定价与离线定价
、
、
我需要一个即插即用的文本识别系统,在尝试了一些解决方案后,例如Tesseract OCR,Google的Vision API似乎对我产生了最好的结果。 然而,我以前从来没有使用过他们的任何云API,但我注意到它能够工作在offline?计费是如何工作的呢?根据我的理解,每1000张图片的在线版本收费,离线库不会绕过这一点吗?线上和线下的质量有什么不同?
浏览 48
提问于2019-09-10
得票数 0
回答已采纳
1
回答
什么是光学字符识别中的表示?
、
、
、
我正在学习OCR和阅读这本书 作者定义了8个过程来实现一个接一个的OCR (2后1,3后2等等): 光学扫描 位置分割 前处理 分割 表象 特征提取 识别 后处理 这就是他们写的关于表示的内容(#5)。 第五个OCR组件是表示。图像表示在任何识别系统中都扮演着重要的角色。在最简单的情况下,灰度或二值图像被输入到识别器。然而,在大多数的识别系统中,为了避免额外的复杂性和提高算法的准确性,需要一个更紧凑、更有特征的表示。为此,为每个类提取了一组特征,这有助于将其与其他类区分开来,同时在class.The字符图像表示方法中保持对特征差异的不变量,通常分为三大类:(a)全局变换和级数展开(b)统计表示
浏览 0
提问于2017-06-06
得票数 4
1
回答
在保存到文本文件时防止拆分行
、
、
、
、
我有一个具有大约300行结构的json文件,如下所示: [ { "OCR":"ANNA żółty LEWANDOWSKA\nHEALTHY SWEETS by Am 31\n", "Correct_title":..., "Correct_author":..., "Correct_ID":... }, { "OCR":"some other\nstuff that should\nst
浏览 6
提问于2021-09-09
得票数 0
1
回答
在OCR之前对信用卡数字进行二进制化
、
、
、
我正在尝试使用OpenCV对信用卡数字进行二值化,以便光学字符识别系统能够识别它们。 因此,在分割阶段和裁剪之后,我执行了以下步骤: 1.将tje图像转换为灰度图像。 2.直方图均衡化。 3.使用(3,3)内核GaussianBlur(digit,bluredImg,cv::Size(3,3),9);的高斯模糊 4.阈值(Sauvola方法)。 以下是我的一些结果,但我认为它们太嘈杂,不足以用于ocr: 指向原始图像的链接: 如果你有一些技巧可以提高我的二值化质量,请与我分享(代码会很棒)。
浏览 1
提问于2013-07-15
得票数 0
1
回答
如何使用OCR从jpg文件中提取数值
、
、
、
我创建了以下代码并执行: Ocr.setUp(); Ocr ocr = new Ocr(); ocr.startEngine("eng", Ocr.SPEED_FASTEST); String s = ocr.recognize(theImage, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PLAINTEXT); ocr.stopEngine(); Output: Result: L‘i L‘L’Ui l 实际上,图像只包含数字值。是否可以使用上述代码仅提取数字值? 我在jpg文件中显示了1234个数值,我只想在o/p控制台中打印这个
浏览 2
提问于2015-11-25
得票数 0
回答已采纳
1
回答
什么是最好的非深度学习手写体数字识别系统?
、
、
什么是最好的序列挖掘算法用于手写体数字识别系统(除了深度学习)?
浏览 0
提问于2017-12-27
得票数 1
1
回答
py2exe生成的.exe在windows系统上显示错误消息
、
、
、
、
我已经开发了一个基于python openCV的光学字符识别系统,并使用py2exe生成了一个.exe文件。问题是它在几个Windows系统上显示了一条错误消息。 错误消息: Exception in Tkinter callback Traceback <most recent call last>: File "Tkinter.pyc", line 1536, in __call__ File "gui_tes3.py", line 89, in VerifyDocument File "gui_t
浏览 2
提问于2016-06-22
得票数 0
1
回答
PDFBox:区分透明文本和非透明文本
、
、
、
我有一个任务,在那里,我必须提取文本,是背后的图像,并已从图像本身OCR编辑。这一案文是透明的。问题是,有一个图像,它的背后有文字,不是OCR编辑的,它只是正常的文本,它是不透明的。如何区分所需(透明)和不需要(不透明)文本? 这是一个具有代表性的pdf文件:图像OCR文本应该在第2页、第3页、第12页上提取,而文本也在第4页上提取。在第4页,图像后面没有OCR文本,但是图像下面有规则文本。我需要过滤掉它,因为我只需要OCR文本。
浏览 6
提问于2021-07-13
得票数 0
回答已采纳
1
回答
pc端微信的图片文字提前,也是用OCR技术实现吗?
、
常用的OCR技术对电脑GPU都有要求,微信是怎么规避这个问题的呢?有没有大神解答下,谢谢
浏览 245
提问于2022-12-07
1
回答
如何判断pdf文件中隐藏的文本层是否来自OCR?
我见过一些pdf文件后,OCR有非常准确的文本(无论是在识别率,在文本对齐图像)。 如果pdf文件中隐藏的文本层是否来自OCR,那么Unix/Linux工具会帮助我知道什么呢?
浏览 0
提问于2014-12-07
得票数 2
1
回答
使用xsane作为没有扫描器的OCR
、
当我启动xsane时,它会以不可访问的消息退出。 但是我想用它作为OCR工具。 如何抑制设备搜索?
浏览 0
提问于2015-07-03
得票数 1
2
回答
新版OCR身份证识别,SSL认证问题?
、
、
、
、
使用新版SDK(java)调用ocr身份证识别接口ocr.tencentcloudapi.com,在云服务器上报一下错误 com.tencentcloudapi.common.exception.TencentCloudSDKException: javax.net.ssl.SSLPeerUnverifiedException-Hostname ocr.tencentcloudapi.com not verified: certificate: sha1/2oGH1NU0zoUGcAYBTGnGkeHt4LQ= DN: CN=*.ap-shanghai.tencentcloud
浏览 1463
提问于2019-09-06
1
回答
OCR只返回图像中几个字的大小
、
、
是否有任何OCR工具只读取图像中某些单词的坐标()。例如,参考附件图像,我只需要两个单词的坐标,即1)“测量”2) "999999.9mi“ 这能实现吗? 我可以考虑将所需的单词作为输入输入到任何OCR工具,如Tessnet2,但没有找到任何合适的功能?任何其他建议都会有帮助。
浏览 4
提问于2015-07-08
得票数 1
3
回答
日本最精确的开源OCR?
、
、
根据您的经验,什么是最准确的开放源码光学字符识别(OCR)库/软件来读取日文文本? 我刚试过nhocr,它的错误率超过2%,即使是在一个非常干净的高清晰度文档上(2%用于大字体的超干净字符,对于扫描过的书籍则更糟糕,更不用说手写形式了)。 日本旧手机(特别是夏普手机)在10年前就有了很好的日本OCR,所以我想它在开源中也是可行的。
浏览 0
提问于2015-02-03
得票数 6
1
回答
无法在Mac上安装Tesseract-OCR
、
我试图用pytesseract在python 2.7.14中编写一个OCR程序。当我运行我的代码: from PIL import Image import pytesseract print(pytesseract.image_to_string(Image.open('test.png'))) 我发现了一个错误: IOError: [Errno 2] No such file or directory: 'test.png' 我搜索了很多地方,似乎我需要安装tesseract-ocr。我跑了: pip install tesseract-ocr 但我发现了
浏览 1
提问于2018-02-19
得票数 3
回答已采纳
1
回答
如何利用OpenCV使图像清晰清晰
、
、
所以我想要OCR,一个有文字的图像 但是输出总是很奇怪,与图片中的文本不匹配。 所以我决定改变图像属性。 我就这样改变它: image = cv2.imread("./image_frames/frame473.png") def get_grayscale(image): return cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) def blur(image): return cv2.medianBlur(image,3) def thresholding(image): return cv2.thres
浏览 0
提问于2020-06-25
得票数 2
1
回答
比较Java for Android中的图像
、
、
所以我正在开发我的第一个android应用程序。这很简单,但它使用OCR,输入来自相机。我正在设计它,以便有参考图像(每个图像上都有特定的字体)。然后,将每个字符图像设计成一个字符串。然后,它将相机拍摄的图像与参考照片进行比较,寻找人物相似性。最后,它输出一个字符串。 我需要一些帮助,我应该如何让应用程序来比较图像。另外,如果你知道创建一个光学字符识别系统的更好的方法,请告诉我(我确实找到了一个叫做JavaOCR的东西(仅适用于桌面系统),但它使用的类并不是在安卓中实现的)。 顺便说一句,我正在Win7上使用Eclipse Indigo为Android 2.2设计它(以防它真的很重要)。
浏览 6
提问于2011-11-11
得票数 1
1
回答
开式CV cv.imread修改图像
、
我使用cv.imread读取python中的png文件。当我使用cv.imwrite函数立即保存图像时,我会发现图像中的颜色略有变化。我试图在这个图像上执行字符识别,而OCR在python中对图像的表现要比原始图像差得多。第一个图像是原始的,第二个是使用OpenCV保存的图像。 我们可以看到绿色略有改变,虽然这似乎并不重要,但却影响了公众角色识别系统,因此,我认为巴布亚新几内亚正在发生其他变化。有人知道为什么会这样吗我怎么能解决这个问题。 代码如下 img = cv2.imread('file.png') cv2.imwrite('out.png
浏览 0
提问于2018-07-09
得票数 2
2
回答
说话人识别的性能:等错误率(EER)和识别精度
、
、
我对用于度量说话人身份识别系统(而不是验证)性能的度量标准感到困惑。 是等误差率(EER),还是两者兼而有之?如果两者兼而有之,哪一个是最重要的?
浏览 2
提问于2017-04-10
得票数 0
回答已采纳
1
回答
应用程序因分段错误而终止
我目前在windows机器上使用ruby 1.9.3,我已经创建了一个工具,可以从oracle数据库中提取记录,并对这些记录进行一些处理。 我正在使用dbi进行连接。在某些表中,它工作得很好,但在某些情况下,它只是失败,并显示以下错误消息: C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/1/ocr21.tmp/lib/ruby/gems/1.9.1/gems/dbd-odbc -0.2.5/lib/dbd/odbc/statement.rb:41: [BUG] Segmentation fault ruby 1.9.3p125 (2012-02-1
浏览 0
提问于2012-02-24
得票数 0
1
回答
识别预配置文本的免费应用程序(OCR)
、
我正在寻找一个免费的Android应用程序,它允许我配置任意数量的字符串(文本)以及自定义注释。应用程序应该通过OCR识别摄像机中的文本,并显示适当的注释。所有这些都应该发生在当地。 能够将配置的字符串->便笺列表从一个设备复制到另一个设备(文件传输,通过USB)是一个加号。通过GUI配置列表并不是绝对必要的,我也可以将手写的Json文件放在某个特定的位置。 背景/用例:我,在一个使用拉丁脚本的地方,正在等待无法阅读拉丁脚本的访问者。为了让他们找到回来的路,我想向他们提供一种扫描一些重要的公交车站名称和其他标志的方法,并对我事先配置好的标志进行解释,而不需要使用数据漫游或本地SIM卡。
浏览 0
提问于2015-06-13
得票数 2
1
回答
如何将pdf文件从灰度转换为黑白?
、
我的操作系统是Ubuntu12.04。如何将pdf文件从灰度转换为黑白?灰度pdf文件来自于带有灰度选项的扫描,并且OCR需要黑白等级pdf。 更新: 根据Marco的答复,B pdf不是很好,原始文件是这里。
浏览 0
提问于2013-07-28
得票数 13
1
回答
Tesseract-OCR (3.02)识别精度和速度
、
我有一组非常小的图片(w:70-100;h:12-20),如下所示: 在这些图片中,除了组成员的昵称外,什么都没有。我想从简单的图片中阅读课文,它们都有一个背景,只是昵称不同。所以,我对这张照片所做的是: 我正在使用下面的代码从第二个图像中获取文本: tesseract::TessBaseAPI ocr; ocr.Init(NULL, "eng"); PIX* pix = pixRead("D:\\image.png"); ocr.SetImage(pix); std::string result = ocr.GetUTF8Text();
浏览 1
提问于2016-07-02
得票数 6
回答已采纳
8
回答
OCR的理想字体是什么?
、
、
有没有人对OCR的不同字体有什么经验?我正在生成一个ID,然后尝试使用tesseract扫描它。目前我只是T&E'n不同的字体,但这似乎是相当低效的。我已经尝试了OCR*系列的字体,以及各种其他字体,如Arial和佐治亚。tesseract容易与OCR*字体混淆。 有没有专门为tesseract设计的字体,或者与其配合良好的系统字体?
浏览 9
提问于2008-11-25
得票数 35
回答已采纳
8
回答
OCR文字识别技术有哪些应用?
OCR 是实时高效的定位与识别图片中的所有文字信息,返回文字框位置与文字内容。支持多场景、任意版面下整图文字的识别,以及中英文、字母、数字的识别。简单来说就是将图片上的文字内容,智能识别成为可编辑的文本,这么强大的功能在我们生活当中有哪些应用呢?
浏览 3611
提问于2018-08-24
4
回答
可以处理拼写错误的单词的regex
、
是否有一种方法来创建正则表达式,以确保在给定的字符范围(例如,20个字符)中有5个字符是按顺序排列的? 我正在处理可怕的OCR/扫描,我可以忍受假阳性。 有办法这样做吗? 更新:我想要将"mshpeln“匹配为misspelling。我不想做OCR。OCR工作已经完成,但是做得很糟糕(也就是说,它最初说的是misspelling,但是OCR的拷贝是"mshpeln")。我不知道我要与之匹配的文本将是什么(即我不知道它是"mshpeln“,它可能是"mispel”或任何其他组合)。 我不是试图用它作为拼写检查器,而只是找到捕获组的结尾。顺便说一句,我目前在
浏览 3
提问于2013-06-04
得票数 0
1
回答
用于多类NER的CRF
、
、
我将开发具有许多(100+)类的命名实体识别系统。假设它们的频率大致相等,哪种算法的性能最好?根据我对CRF工作原理的理解(不幸的是,距离理想很远),它在这里应该是可以的。但在一些来源()中,我发现了另一种观点。 那么,CRF算法是否适用于具有大量类的NER?
浏览 3
提问于2014-08-10
得票数 1
2
回答
通用ocr 返回 -3 ??
通用ocr返回 -3 异常是超时,请问下 这是怎么回事? {"code":-3,"message":"HttpRequest:url:http://recognition.image.myqcloud.com/ocr/general, method:POST, ConentType:multipart/form-data\nHeaders:\nkey:Authorization, value:ehMtjcpbvpnFx7Tqp5x4LgSWpBhhPTEyNTE2OTcwODEmYj10ZXN0MSZrPUFLSUQ3RUF5ZDdaYWFQMlVscX
浏览 435
提问于2018-09-19
3
回答
用于阿拉伯语的开源OCR库
、
、
、
我四处寻找一个OCR库-最好是开源的-我可以在一些阿拉伯语pdf上使用它。在谷歌上搜索也没有找到任何有用的东西。我想知道是否有人知道相关的OCR库,甚至可以在相关语言(波斯语和乌尔都语可能是相关的)上工作的库,可以添加阿拉伯语支持。 任何关于如何实现这一点的一般性建议都将不胜感激。
浏览 5
提问于2011-01-15
得票数 15
1
回答
基于立体视觉的目标识别
、
、
、
我正在使用OpenCV Haar级联分类器创建一个静态手势识别系统。我最终想把这个识别系统变成一个立体识别系统。这是我的问题,我是否可以使用由Haar Cascade分类器创建的2D识别系统,并在两个摄像头上实现它,以便在使用OpenCV中包含的立体校准功能后创建视差图?或者,我是否必须用我已经校准的立体系统拍摄照片才能创建级联分类器? 很难找到关于这个主题的好信息,我想在购买和创建一切之前规划我的项目,并确保我做的事情是正确的。 谢谢。
浏览 1
提问于2013-11-13
得票数 2
1
回答
通过DateTime更新access中的C#。数据失配
、
、
、
我有一个日期和时间加载到一个文本框进行编辑,但我需要将它作为一个日期时间存储在我的access数据库中,而不是一个字符串,并且无法在我的SQL参数中记住或找到解析它的语法。这是我的密码。 string strSql = "UPDATE OCR SET OCR = @OCR, [OCR Title] = @OCRTitle, DeadlineDate = @DeadlineDate;"; using (OleDbConnection newConn = new OleDbConnection(strProvider)) { using (OleDbCommand d
浏览 4
提问于2014-01-16
得票数 0
回答已采纳
2
回答
如何从iOS上的图像(一些专门为此目的创建的库)解析一个众所周知的格式的字符串?
、
、
、
在俄罗斯的圣彼得堡,当地的旅行卡上有大量的身份证号码,这些号码很难读懂,当你在网上打卡的时候,就会在网页上输入。因此,我想建立一个小应用程序,可以拍摄一张旅行卡的照片,并分析出数字。 这项任务比自由形式识别要容易一些: 卡的大小是众所周知的。 id号码是已知大小的,位于卡上非常知名的位置,它们只是编号,没有字母(好的,我认为有两个变体,也许它们将来还会增加1-2个)。 甚至字体都是预先知道的。 即使前几个数字对大多数卡来说也是相同的(到目前为止,只有两个前缀)。 你会怎么做?是否有任何库不是为普通OCR而调的,而是像我所需要的“暗示”OCR? 向你问好阿特姆。
浏览 7
提问于2016-07-11
得票数 1
1
回答
基于Tesseract-OCR和OpenCV的土耳其字符识别
、
、
、
、
我正在尝试使用Tesseract-OCR和OpenCV在Python中检测图像的文本部分(jpg文件)。图像的文本部分是土耳其语,因此我使用的是Tesseract-OCR文件中的“土耳其培训数据(Tur)”。在使用之前,我使用了膨胀和腐蚀来消除噪音。 问题是,即使可以检测到某些特定区域的字符,但检测结果大多是不成功的,无法检测到土耳其字符。你知道什么方法吗?或者你有什么建议来获得更多的成功。以下是我的代码: import pytesseract from PIL import Image import cv2 img= cv2.imread('C:\Users\gulsa\De
浏览 4
提问于2017-11-06
得票数 0
回答已采纳
1
回答
用模糊文本改进Tesseract OCR结果
、
、
、
我正在致力于印刷文本的OCR识别。特别是,我着重于预处理步骤,以改进引擎的结果。通过自适应阈值处理、噪声去除、文本分割等,取得了良好的效果。但是,当其他商业产品获得不错的结果时,Tesseract似乎还是失败了。 我使用了下面的测试映像,下面是与两个商业OCR相比,Tesseract 3.04获得的结果。所有3项服务都提供了相同的二值图像,其中包含了一些稍微模糊的文本。 Tesseract Careers in Technology Consulting Networking Lunch 21 m 2014, 11:00 - 14:30 Definingthecorporatel
浏览 3
提问于2014-12-27
得票数 16
1
回答
即使在释放PhraseRecognitionSystem之后,口述识别会话也不会启动
、
在Unity上,我正在测试关键字识别和口述识别器,并在两个按钮上分配了以下功能。 Unity doc说短语识别系统不会从听写识别系统开始,但它没有在关键词识别器的文章中提到这一点。在这个测试中,一切都正常,但即使我启动关键字识别器并在下一次单击时处理它,在另一个按钮上单击口述识别器将不会启动,并显示以下错误: Cannot start dictation recognition session while PhraseRecognitionSystem is running. 下面是first按钮的OnButtonClick方法的代码: if(start != true)
浏览 3
提问于2018-07-13
得票数 3
1
回答
用于与程序集成的免费、燃烧速度OCR软件
、
、
、
、
我需要做光学字符识别在某一窗口的特定位置,以作出一个附加的应用程序。该应用程序是一个用HGE编译成可执行文件的C族游戏。有什么好的OCR解决方案吗? 它需要能够在秒或毫秒内处理屏幕上的所有文本。 我在处理几种不同的字体,每种字体都是一样大小的,总是这样。几种不同的颜色。有些文本具有一致的颜色或渐变背景,但大多数没有。 OCR应该在Windows 10或最新的Ubuntu上运行。 是否有任何OCR程序,我可以提供字体数据?图像还是ttf?
浏览 0
提问于2015-06-26
得票数 5
7
回答
需要良好的OCR打印源代码清单,有什么想法吗?
在我的工作中,有时我需要一些打印的源代码,并手动将源代码输入到文本编辑器中。不要问为什么。 显然,输入它需要很长的时间,而且总是需要额外的时间来调试输入错误(oops遗漏了一个"$“签名)。 我决定尝试一些OCR解决方案,比如: Microsoft已构建在OCR 中 结果:遗漏了所有的空格,漏掉了所有的下划线,错误地解释了许多标点符号。 结论:比手工输入代码要慢。 各种在线网络OCR应用程序 结果:与Microsoft文档映像相似或更糟 结论:比手工输入代码要慢。 我觉得源代码非常容易OCR,因为字体是无衬线和单空格。 你们中
浏览 10
提问于2009-12-11
得票数 13
回答已采纳
1
回答
无法重新安装服务
、
、
、
我试图为一个应用程序创建一个自动更新,但是我在更新部分遇到了一些问题。基本上,我所拥有的是一个windows服务,它定期检查更新,当它找到和更新时,它会启动一个控制台应用程序来更新自己。控制台应用程序的代码如下。 我遇到的问题是,当我卸载服务并替换驱动该服务的文件时,我会得到一个system.badimageformat异常。尽管重新安装了相同的文件。如果我卸载和重新安装文件,而不下载和替换它从FTP,没有问题,但一旦我改变文件,它开始给我异常。有没有人对我如何解决这个错误有任何想法。我相信这不是一个32比64位的问题,这通常是导致这个错误的原因。 static void Main(s
浏览 2
提问于2015-02-17
得票数 0
回答已采纳
1
回答
COS+离线识别这个是只要我在对象存储管理上传文件,后台就会自动触发识别,并且把结果写到cos上吗?
、
请描述您的问题 另外一般需要多久呢?比如10分钟的语音文件,需要多久能转换成文字? 标题:简介 - 智能语音服务 - 文档首页 - 腾讯云文档平台 - 腾讯云 地址:https://cloud.tencent.com/document/product/441/6199
浏览 160
提问于2018-03-12
1
回答
在web应用程序中,OCR(光学字符识别)应该使用客户端或服务器端。
、
、
、
我将扫描一个图像并上传到数据库中。我使用mongodb存储文档,.There是在文件中搜索的要求,如果我使用OCR,这是可能的。所以我应该在客户端还是服务器端使用ocr。我正在使用microsoft服务器。我已经考虑过我的脚步了。 ( 1)扫描一个或多个文件。 2)将mongodb中的文件存储为pdf文件。 2.1) OCR扫描图像,并将其保存为PDF格式,并随OCR结果一起上载到数据库。 3)在数据库中搜索关键字,获取图像ID。 4)以pdf格式以查看器加载文件。 因此,请建议我最好和最简单的方式来实现我的目标。
浏览 3
提问于2016-12-13
得票数 0
回答已采纳
1
回答
MODI的OCR替换
、
、
我最近一直在使用MODI的内置OCR功能来捕获窗口的文本。我使用窗口句柄,可以获取任何区域的文本,也可以获取要搜索的特定文本的坐标。 看起来MODI已经过时了,我们现在使用的office 2010中并没有包含MODI,所以我需要找到一个新的OCR替代方案。我还可以使用其他好的库吗?
浏览 11
提问于2010-06-18
得票数 1
1
回答
如何使用人工智能开发光学字符识别器?
、
、
我已经开发了一种OCR,它完全致力于字体和大小。我只是用来计算字体的高度和宽度,找出我与数据库值比较的比率,然后选择字体。 我想将逻辑扩展到所有类型的字体和大小。我想用人工智能来做。我看过一些开源OCR的编码。但是,它不会有什么用处。 请指导我应该遵循/开始开发我自己的OCR的方法。我想让它成为一个全世界的Oper Source项目,也想为Java中进一步的项目具体开发提供API。 提前谢谢。
浏览 1
提问于2012-04-30
得票数 4
回答已采纳
1
回答
双语图像(含文本)检测
、
、
我有几个包含文本的图像,我想在上面执行OCR,但问题是一些图像是双语的,包含英语和阿拉伯语文本,还有一些是纯英语。我怎样才能检测到这些双语页面?我只想要英文的OCR。
浏览 1
提问于2016-03-10
得票数 0
1
回答
模拟视频(VGA)信号的简易OCR
、
、
、
有没有人知道有什么产品或开源项目可以对VGA流进行OCR (光学字符识别)?VGA屏幕非常简单,数字和字符串位于固定的位置。屏幕不会经常改变,或者当它们改变时,每隔几秒钟读出一次就可以了。 为什么要麻烦呢?我想将一些没有任何数字接口的老式医疗设备连接到网络。我会使用VGA分离器来分离VGA信号,对其运行OCR,然后将识别出的数字/字符串提供给各种程序。我在这里谈论的是非常简单的OCR,比如从000.0到359.9的数字。 有没有人见过这样的东西?
浏览 2
提问于2011-02-16
得票数 0
回答已采纳
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
情感感知OCR:整合深度学习技术提升文字识别系统的情感理解能力
OCR-文字识别
OCR文字识别工具
手写OCR文字在线识别
在线Ai免费文字识别 OCR
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券