腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
2
回答
是否使用OCR引擎识别Micr字体?
、
、
、
我正在使用Microsoft OCR Library来阅读文本。 Microsoft OCR库工作正常。但是,我想阅读链接中给出的以下字符列表。有没有一种方法可以训练OCR库来读取以下字符,或者是否有一种语言可以读取以下字符。
浏览 2
提问于2016-08-08
得票数 2
1
回答
有没有可以针对新符号进行训练的OCR?
、
、
、
、
有没有免费/开源的OCR可以训练新的符号,还可以输出在目标图像中找到的符号的坐标?我读到tesseract OCR是可以训练的,但是在OCR之后它能给我坐标吗?有什么例子吗?我需要使用包含一个sybmol的图像来训练ocr的代码/步骤。每幅图像中大约有20个符号需要训练。然后使用经过训练的OCR来检测目标图像中的这些sybmols,如果找到了,则也给出坐标。
浏览 3
提问于2011-05-31
得票数 2
回答已采纳
2
回答
Tessaract OCR是否使用神经网络作为它们的默认训练机制?
、
、
、
抱歉,这可能是个愚蠢的问题。但我对机器学习和Tessaract OCR相当陌生。我听说Tessaract OCR是可以训练的。 我需要知道的是,Tessaract OCR是使用神经网络作为它们的默认训练机制,还是我们必须明确地编程才能使用神经网络? 如果我对这个“训练”概念想错了,很抱歉。但我需要确切知道的是,Tessaract已经使用了NN,如果不是,我如何使用NN和tessaract OCR来提高识别精度? 如果有人能建议我一些好的资源/方法来参考/尝试和开始,这也是一个很大的帮助。 我目前所知道的基本机器学习,监督训练的概念,并执行基本的图像OCR操作在Tessaract OCR。
浏览 3
提问于2015-04-10
得票数 12
回答已采纳
2
回答
除tesseract-android-tools之外的ocr库
、
、
我已经创建了一个基于ocr的android application.Is,除了tesseract之外,还有其他可用的库吗?因为它已经被code.google.com.Asprise弃用了,它似乎不是一个独立于平台的OCR。我已经尝试过Ron Cemer的Java OCR库,但他们是针对每个字符和喜爱的格式进行训练的。 我没有办法从这篇parts.Pls帮助中找到一个与tesseract具有相似性能的合适的库。 您提供的任何反馈都将是值得注意的。提前感谢
浏览 1
提问于2013-05-02
得票数 3
1
回答
Android手写识别库
、
、
、
、
我目前在Android中使用tess-two库进行OCR,它根据输入图像和训练数据给我们一个结果。我想要做的是基于以前的手写数据建立我自己的训练数据。我研究了如何使用tesseract:在Linux系统上训练数据。 tesseract支持在android上做这样的事情吗?还有没有其他库提供这样的功能?
浏览 1
提问于2014-03-05
得票数 3
1
回答
可延长或培训Tesseract OCR吗?
、
我正在寻找一个OCR库,它允许我读取图像中的文本,但只有被圈起来的文本。我想得到一些关于Tesseract OCR这个任务的反馈。它看起来很强大,但很复杂。HOw会在这里使用吗,我能接受这样的训练吗?还是应该延长?
浏览 3
提问于2013-10-14
得票数 0
回答已采纳
1
回答
视频中的OCR?openCV或使用光学字符识别的图像处理?
、
、
我必须写一个程序,从司机前面的车内屏幕上拍摄的视频中进行OCR,所以它只对数字进行OCR。我正在努力寻找实现它的方法。我正在考虑使用openCV,但作为另一种选择,我正在考虑使用一个从视频中提取帧并找到数字的光学字符识别程序。但是许多OCR程序不能正确识别数字(也许OCR需要训练?)。所以我想使用计算机视觉库来完成这项工作。 你认为实现这个简单程序的最好方法是什么? 我认为使用计算机视觉库和匹配的模板会很好,但也可以帮助me.for例如有程序做车牌识别。 所以任何建议都是受欢迎的。
浏览 6
提问于2012-06-30
得票数 5
回答已采纳
1
回答
如何使用keras image_ocr示例预测OCR的结果?
、
、
、
Keras OCR示例演示了一个使用堆叠的CNN和RNN开发的非常简单的OCR系统。但是在训练之后如何使用训练好的模型来预测结果呢?
浏览 0
提问于2017-09-28
得票数 2
2
回答
训练印地语的tesseract
、
我想用印地语训练我的测试用法。我有许多‘印地语’书写的特定字体的文本图像,我想为这些图像训练tesseract ocr。有几次我尝试使用这个链接来训练tesseract。当我运行makebox命令时,它会提取box文件,但它可以识别像英文字符一样的文件。我不明白为什么会这样。请帮助我训练印地语的tesseract ocr。你可以在下面的链接上查看示例图像。
浏览 3
提问于2014-12-20
得票数 0
3
回答
日本最精确的开源OCR?
、
、
根据您的经验,什么是最准确的开放源码光学字符识别(OCR)库/软件来读取日文文本? 我刚试过nhocr,它的错误率超过2%,即使是在一个非常干净的高清晰度文档上(2%用于大字体的超干净字符,对于扫描过的书籍则更糟糕,更不用说手写形式了)。 日本旧手机(特别是夏普手机)在10年前就有了很好的日本OCR,所以我想它在开源中也是可行的。
浏览 0
提问于2015-02-03
得票数 6
1
回答
GetCustomModelsAsync找不到OCR表单标签工具模型id
所以,我建立了OCR表格标签工具,让一切都工作得很好,在跑步训练之后,我得到了一个模型id。现在,我想在.NET中使用表单Recognizer客户端库时使用该模型。两者都指向相同的表单Recognizer服务和Azure Blob存储。 但是,当我运行GetCustomModelsAsync时,它不会返回在OCR表单标签工具中创建的模型,如果我从标签工具中复制model,GetExtractedKeysAsync就找不到模型(它确实找到了一个不一样的模型,因此它正在工作)。相同的订阅键,相同的端点。 如何使用在.Net客户端库中的OCR表单标签工具中创建的模型。我遗漏了什么?
浏览 0
提问于2020-05-25
得票数 0
回答已采纳
1
回答
attention_ocr模型如何使用图像/类?
我正在准备自己的数据集来训练attention_ocr模型。我正在尝试修改以准备我的数据集。指定的目的是什么(对于inception,对于attention_ocr,它看起来是),attention_ocr如何使用它?
浏览 13
提问于2017-07-10
得票数 0
回答已采纳
3
回答
应付款发票采集或自动提取
、
、
、
、
我正在创建一个桌面/winform应用程序,读取tif/pdf应付款发票并提取所有发票信息以存储到数据库中。 我可以读取标准条形码(QR代码,Code39等)和一些应付发票的标准字段(发票日期,公司名称,地址)与OCR (ocr特定区域的图像),但无法捕获线项目,金额正确。 我分两个阶段提取信息: 根据模板读取特定区域(特定字段的用户映射区域) OCR整页并搜索应付发票标准字段名和值 我有以下三种方法: 为一种类型的发票创建一个模板并处理所有发票。 基于神经网络的引擎,需要经过样本数据的训练才能基于模式工作。 表单处理,一种OMR。OCR用于查看放置在表单上的字段的
浏览 5
提问于2013-11-16
得票数 6
回答已采纳
1
回答
遇到问题培训tesseract
我刚接触tesseract,对github页面中的不同目录感到有点困惑。 tesserac-ocr代码库就是我安装的。在/usr/local/share/ tessdata /中安装了tessdata目录 因此,现在在训练tesseract时,我运行以下命令- # tesseract img.tif img box.train 我得到以下错误 Tesseract Open Source OCR Engine v3.03 with Leptonica Error opening data file /usr/local/share/tessdata/eng.traineddata Please
浏览 1
提问于2015-08-16
得票数 3
1
回答
合并两个OCR训练数据
、
、
我正在尝试识别一个图像(表格)并转换成文本,目前使用谷歌的egg.trained数据"tesseract-ocr“,这对打印字符和手动书写的一个(由人手动书写)我开发了一个训练的数据,这对我训练的字符很好。nOw我想合并这两个训练过的数据(tesseract-ocr +我自己训练过的数据),这样我就可以在一个表单中识别手写和打印的字符,请告诉我如何将这两个文件合并为一个。
浏览 1
提问于2012-02-19
得票数 3
1
回答
如何正确加载pytorch pth模型并与其他模型组合?
、
、
我正在寻找一个OCR预先训练的模型,与pytorch一起工作。我尝试过,但pytorch集线器不支持它。我不能加载pth模型,因为它只有权重。如何加载模型? 我的第一个模型是在自定义数据上训练的yolov5模型,因此它应该裁剪图像并将其发送到下一个模型。下一个模型应该是OCR,主要是数字识别。但我不能运行craft-pytorch model = torch.hub.load('.', 'custom', path='runs/train/exp2/weights/best.pt', source='local', force_r
浏览 0
提问于2021-10-11
得票数 1
1
回答
如何找到、下载和安装经过培训的PaddleOCR模型?
、
、
、
告诉我如何为找到和安装经过训练的OCR模型?因为我对GitHub上的正式文档感到困惑。为PaddleOCR寻找一个“智能和完整”的OCR模型。
浏览 19
提问于2022-01-03
得票数 1
1
回答
Tesseract OCR上的数字数字
、
、
解决方案: 我必须训练我自己的数据才能用OCR来尝试。这似乎很好,但我不知道为什么来自阿图鲁斯托的受过训练的数据不适用于我= 为了获得OCR的良好结果,我已经完成了这个阶段(我用OpenCV完成了这个阶段): 首先,将图像转换为黑白 第二,将高斯模糊应用于图像。 第三,将阈值滤波器应用于图像。 这样,就可以识别七段数字。 问题: 我正试图通过Android上的Tesseract获得一个OCR,我正在用这张图片测试这个应用程序(通过): 我使用的是由arturaugusto ()训练的数据,但是OCR的错误结果是: 884288 零被认为是8,我不知道为什么。 我
浏览 3
提问于2015-05-27
得票数 11
2
回答
Matlab有内置的OCR库或工具包吗?
、
、
、
我需要一个预先建立(即已经训练)的OCR库,可以识别简单的字符(标准字体如Arial,Times New Roman,Courier等)。Matlab的工具箱中有没有类似的东西?或者我必须使用像Tesseract这样的外部程序(以及使用系统调用的接口)?
浏览 2
提问于2012-11-09
得票数 4
回答已采纳
1
回答
CNN OCR机器可读区域
、
、
、
我正在训练一个卷积神经网络来识别智能手机上的MRZ(机器可读区域)字符。我想知道是否为了提高准确性,我应该用多种字体训练它,即使MRZ只使用OCR-B。此外,该模型在设备上的执行精度与我用来训练/测试它的python代码中的精度水平不同。有什么想法吗? 这是我正在使用的架构: model = Sequential() model.add(Convolution2D(filters=32, kernel_size=(3, 3), strides=(2, 2), activation='relu', input_shape=input_shape)) mod
浏览 4
提问于2019-03-21
得票数 1
1
回答
Tesseract-OCR:需要训练所有类型的样本吗?
、
我想做一个应用程序,可以将打印的名片转换为文本。我了解到tesseract-ocr可以通过训练提高准确性。 如果我希望每种类型的名片都有很高的准确率,我需要训练所有类型的名片吗?有数百种类型的名片具有不同的字体或格式。有没有其他方法可以在tesseract-ocr中达到高精度?
浏览 23
提问于2016-01-22
得票数 0
1
回答
在lubuntu 18.04上安装tesseract 3.04
、
我想在我的Ubuntu/Lubuntu18.04测试设置之一上安装tesseract-ocr 3.04 (它在我们的lubuntu16.04测试设置上运行得很好)。如果我通过'sudo apt install tesseract-ocr‘等简单安装tesseract-ocr,它将安装tesseract 4.0.0 beta。有了这个,我看到了很多奇怪的行为,并希望使用相同的训练数据等运行tesseract-ocr 3.04,因为它在我们的旧测试设置上运行得很好。 如何强制安装旧版本的tesseract-ocr? 谢谢,马丁
浏览 7
提问于2018-09-24
得票数 3
1
回答
可以训练Azure OCR
我正在尝试Azure认知服务OCR,以便在身份文档中进行扫描。它工作得相当好,但我想知道是否有可能训练OCR引擎或以某种方式将其链接到学习服务,以提高字符识别?
浏览 25
提问于2019-02-05
得票数 1
1
回答
如何在我的图像上提高引擎的准确性?
、
我使用tesseract引擎对图像进行OCR,如下所示。 我使用了eng lang,并将引擎配置为一个白名单:“0123456789abc” pOCREngine->SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz"); 准确度不高,约10%左右。我试着用200幅这样的图像训练发动机,并将训练后的数据与eng+mytrainedfont相结合。准确性没有提高。 有没有人知道如何改进这些图像的OCR?谢谢你的进阶。
浏览 2
提问于2016-03-14
得票数 1
1
回答
在Tesseract培训中将字符添加到现有字体中
、
有没有一种方法可以将字符添加到现有的字体中,该字体是为Tesseract OCR训练的? 我刚训练了一种新字体,但它把冒号(':')误读为‘2’ 所以,我想把它训练成识别结肠,而不需要重新训练我刚刚训练过的所有东西。这有可能吗?
浏览 3
提问于2016-03-18
得票数 2
回答已采纳
2
回答
.Net中的阿拉伯文OCR
、
、
、
我使用了Tesseract,并用完整的单词作为字符进行了训练,中国的OCR做得怎么样。但这杀死了我自己的字体,这是一个既耗时又缓慢的过程。这种方法对于某些场景很好,但我想训练基于阿拉伯字符的tesseract。 或者建议我,这可以帮助我开发我自己的阿拉伯语ocr,无论有没有Tesseract。 我研究过OpenCV,但并不顺利。 我将高度赞赏你的快速反应。
浏览 0
提问于2015-12-10
得票数 1
1
回答
使用斯坦福分类器进行字符识别
、
、
我正在开发一个与OCR相关的android应用程序,我需要使用多元逻辑回归对字母表进行分类。我的问题是,我可以使用斯坦福分类器()进行字符识别吗?如果它可以在图像数据集上进行训练?如果我不能,请为我推荐一个JAVA库。
浏览 4
提问于2015-10-13
得票数 0
3
回答
为Tesseract OCR创建培训图像
、
我正在为Tesseract OCR编写一个训练图像的生成器。 当为Tesseract OCR的新字体生成培训图像时,最佳的值是: 新闻部 以点为单位的字体大小 字体是否是反别名的? 如果包装箱合适的话: ,或者不是:
浏览 10
提问于2012-11-16
得票数 8
回答已采纳
1
回答
示例标注工具OCR文本检测问题
、
、
我有一个关于Azure Form Recognizer的手写文本OCR的问题。 在Azure的示例标签工具中添加标签之前,在手写PDF文件上运行OCR时,OCR通常会错误地检测文本。对于其他表单分析和提取技术,通常提供一个选项来输入应该被检测到的文本,以本质上“校正”OCR。对于在示例标签工具(Docker图像)中训练Azure Form Recognizer,我看不到一种覆盖OCR文本并输入正确文本的方法。 有没有一种方法可以自己输入OCR检测不到或检测不正确的文本? 例如,下面的图片是Azure的示例标签工具中的OCR拾取的:OCR detection sample image。 有没有
浏览 37
提问于2020-07-15
得票数 1
回答已采纳
2
回答
开源希伯来语OCR
、
、
Linux中有免费的希伯来OCR吗?Hocr不算,因为它的质量太差了。我发送计算机生成的文本(不是扫描,只是保存作为一个gif)通过它,它不能捡到任何东西。 📷 对于OCR来说,这似乎是一个相当简单的图像。这些天来,它看起来不像一个CAPTCHA,但我听说OCR能够解析它们。如果是这样的话,这个图像就更加如此了。没有曲线,线切割文本等,但hocr不能OCR它。 如果不是,至少要一些可训练的东西(我给它500个字母,然后它将在此基础上做OCR )。
浏览 0
提问于2015-07-17
得票数 10
1
回答
有人能在这张图像上成功地执行OCR吗?
、
、
、
、
我试过从网上下载一些演示来测试这个图像上的OCR,图像上的字符不是很好的打印字符,当你输入一个TextBox时你可以看到。我对OCR和神经网络没有足够的经验。这是我的照片和 我有一些问题要问: 我是否需要用这些新的非标准字符重新训练神经网络,网络已经使用标准字符集进行了训练。(我的意思是,在TextBox中输入任何指定字体的字符时,标准字符看起来就像您看到的字符)。 你能用一些例子对我上传的图像执行OCR吗?如果可以的话,请给我那个工作的例子? 您的帮助将不胜感激!
浏览 2
提问于2013-06-23
得票数 1
1
回答
我怎样才能成为Android tesseract提高认知度的人呢?
、
、
我正在开发一个Android OCR。在Android中使用tess-two制作了OCR。我已经从下载了'traineddata'(tess-two)文件。 我想提高“训练数据”文件的识别性能。但我发现只有iphone或C++语言的代码。请告诉我如何提高Android 'traineddata‘的识别概率。
浏览 4
提问于2016-08-08
得票数 0
1
回答
Microsoft Vision Api - VisionServiceException:执行POST请求时出错!收到错误码: 400
我正在使用Microsoft vision api从图像中读取文本。它在我的三星手机(操作系统: Android M)、联想K4笔记本(操作系统: Android M)上运行良好。 我还有一部夏普AQUOS(操作系统: Nougat)的手机。在这部手机中,文本识别失败。vision api返回此异常, VisionServiceException:执行POST请求时出错!收到错误码: 400 有人遇到过这个问题吗?请给我一个解决方案。 我的代码如下所示。 Bitmap bitmap = CustomCameraStore.getInstance().getBitmap1();
浏览 0
提问于2018-10-22
得票数 0
1
回答
如何使用OCR从指定位置提取文本信息?
、
、
、
用户上传表格数据与信息,如班级,教授,时间表等。 我想轻松地提取这些信息。 我可以使用OCR库,但它只是输出随机混合的文本。 我不知道什么东西是属于什么的。 有没有一种方法可以训练OCR只看图像(表格)的特定部分,然后标记数据,这样当它提取时,它就都被标记了。等 假设我有一个包含大量数据的表单,我希望它只查看地址部分并标记它。 或者它像电子表格一样的数据,我希望它按列来标记它。 简单地将所有文本提取为字符串并不是那么有用。
浏览 0
提问于2017-08-11
得票数 1
1
回答
7段OCR java应用程序
、
、
、
、
我已经为这个项目工作了几个月了,需要一些帮助。我试图识别图像上的字符从一个旧相机,使用七段LED,以印框号码在右下角图像。问题是,这些图像是人和肤色混乱的一些图像与较轻的肤色。但一般情况下,大多数OCR都无法被传统的OCR所识别,我试图使用Tesseract,但在编译应用程序时没有成功,只是为了测试和训练它。我在这里要问的是,是否有任何其他人有类似的问题,或知道一个替代的特斯拉,以能够识别这些字符。最好是一个可训练的ocr。我的搜索结果是无效的。
浏览 4
提问于2015-11-11
得票数 2
回答已采纳
2
回答
在python中使用tesseract 4
、
、
、
我已经在python和pytesseract(来自Pypi)中使用了tesseract 3.04,现在我想使用基于4.00.00alpha的新LSTM 我使用的是kali linux,所以我安装了libtesserct4(使用apt-get),它在tesseract-ocr中创建了名为4.00的文件夹,但当我尝试将它与pytesseract一起使用时,它无法识别--eom input 代码是: pytesseract.image_to_string(Image.open(filename),lang="en",config='--eom 2') 结果: read
浏览 2
提问于2017-12-26
得票数 2
1
回答
Android OCR结果与数据库的匹配
、
、
、
、
所以我试着用OCR把我用手机的摄像头记录下来的文字翻译成字符串,我目前正在为android系统使用谷歌vision OCR,并且正确地实现了OCR,问题是有时候结果并不像预期的那么好,这就是为什么我认为一个解决方案是将OCR的结果与我的数据库相匹配。例如,如果我的相机上写着“你怎么样?”然后我会在我的数据库中找到一个类似的条目“你好吗?”而不是展示这个。所以真正的问题是OCR不断地从摄像机中读取,所以这意味着我需要向服务器发出HTTP请求,每隔一两秒钟就查询数据库中类似的匹配,等待响应,如果有很多用户重载服务器,执行可能会非常糟糕。我认为一个解决方案是下载数据库中所有字符串的列表,并在本地进行
浏览 0
提问于2018-10-16
得票数 0
回答已采纳
1
回答
在windows phone上运行Tesseract Ocr?
、
、
、
我使用tesseract Ocr,训练Tesseract ocr引擎并结合数据是为了实现像7段display.Here这样的数字显示的识别是问题所在,将图片转换为tiff并生成.box文件我使用的是需要java运行时支持的JTessBoxEditor,然后我运行WPF应用程序来训练Tesseract引擎,但它总是识别为8。我如何才能在windows phone上运行所有这些?我需要在Azure上创建虚拟机然后链接它吗?或者其他更容易、更快的方式,让它在windows phone上运行?
浏览 1
提问于2016-11-08
得票数 0
2
回答
如何使用我自己的图像构建FSNS数据集以引起注意OCR tensorflow模型
、
、
、
我想要应用注意-ocr来检测车牌上的所有数字。我已经阅读了你在github上的attention_ocr的README.md (),以及我应该如何使用我自己的图像数据来训练带有StackOverFlow页面的模型()。但是,我没有得到任何关于如何存储图片的注释或标签的信息,或者这个问题的格式。对于目标检测模型,我可以用LabelImg生成我的数据集,并将其转换为csv文件,最后生成.tfrecord文件。我想在FSNS数据集格式上制作.tfrecord文件。 你能给我一些建议来进行这个训练步骤吗?
浏览 1
提问于2019-05-09
得票数 0
1
回答
如何在opencv中使用tessdata?
、
、
、
我已经使用C#创建了一个基于Tesseract的OCR,但它没有在其他计算机上运行。所以我在想,是否可以在OpenCV中使用Tesseract经过训练的数据,或者至少将经过训练的数据转换为XML文件。
浏览 0
提问于2014-03-12
得票数 0
1
回答
如何在tesseract中合并训练数据文件?
、
大家好,有没有办法合并或组合不同字体的训练数据文件,并在Tesseract-OCR中使用它们?
浏览 1
提问于2012-07-27
得票数 3
回答已采纳
1
回答
用预定义的字体图像训练"tesseract ocr“
、
、
、
、
我试图使OCR从图像中识别ASCII字符串。我正在使用Tesseract3库,但是在正确识别方面我有一点问题,所以我需要用新的字符集(这是特定的)来训练它。我已经发现了这个如何:,但是由于图像测试集的简单性,本教程有一些我不需要的不必要的过程。我的图像数据集只包含1行,其中每个ASCII字符在所有图像中都是相同的(没有旋转,没有缩放),但是在行中的字符之间有可变的距离(仅为水平的)。 如何使用字体图像来训练识别算法?
浏览 2
提问于2014-06-05
得票数 4
1
回答
使用OCR从护照图像中提取键值格式的数据
、
、
、
我的目标是使用基于OCR服务器的解决方案从护照图像中提取关键值格式的数据,以便数据保留在本地。我尝试了Azure Form Recognizer Container (认知服务表单识别器API V1预览)。但结果并不令人满意,因为从训练数据创建的模型无法提取任何键值对。我尝试了各种训练样本数据,也参考了,但都不起作用 或者有没有人知道任何其他的服务器产品,库或解决方案,商业或开源,甚至在.Net中的方法,最好是可以帮助以下; 非常感谢您的帮助,谢谢
浏览 1
提问于2020-08-19
得票数 0
1
回答
Tesseract培训数据文件
、
我正在用android做一个关于OCR的项目,以便从图像中识别数字。我的形象只包含数字。我尝试了'eng.traineddata‘文件,但结果的准确性太低,大约在40%以下。有人知道数字的“训练数据”文件吗?我试过下雨了。因为我不熟悉训练。请帮我找一个识别数字的“训练数据”文件。
浏览 1
提问于2014-05-22
得票数 1
回答已采纳
1
回答
如何用Tesseract OCR获得最精确的结果
、
、
我正在建造/培训Tesseract,以便从一张照片中识别护照MRZ代码。在将照片/图像发送到Tesseract引擎之前,我正在应用以下图像预处理技术: 二值化 归一化 采样 去噪 减薄(可选) 此外,我已经用正确的字体(OCR)训练了Tesseract引擎,创建了许多框文件(来自35个左右的示例,其中包含来自OCR字体文本样本的照片),修复了框文件中的任何错误,创建了培训文件,最后用我的所有示例训练了Tesseract引擎,并生成了一个培训数据文件。 然而,即使在所有这一切之后,在C# (引擎模式=默认,页面模式=汽车)中使用我的自定义培训数据,Tesseract
浏览 1
提问于2018-01-24
得票数 1
1
回答
Tesseract使训练遗漏了训练的基础事实
我正在尝试用图像训练Tesseract,我找到了这个,我已经按照说明训练图像,但我一直收到这个错误 Tesseract Open Source OCR Engine v5.0.0-alpha-635-g90405 with Leptonica Page 1 Warning: Invalid resolution 0 dpi. Using 70 instead. find data/foo-ground-truth -name '*.lstmf' | python3 shuffle.py 0 > "data/foo/all-lstmf" Error: mis
浏览 1
提问于2020-03-09
得票数 1
1
回答
如何训练tesseract在低DPI中识别小数字?
、
、
我从视频中获取数据,所以我无法重新扫描图像,但如果需要,我可以缩放它们。 我只有有限数量的字符,1234567890:,但我无法控制原始图像或字体的dpi。 我试图训练tesseract,但没有任何明显的效果,测试项目位于,但目前的结果真的很糟糕。 截取的原始图像示例: 用于OCR的后处理图像示例: 在这种情况下,我如何改进OCR过程?
浏览 1
提问于2011-11-25
得票数 4
回答已采纳
1
回答
使用Keras OCR返回字符串
、
、
我正在使用一个Keras OCR的例子来检测图像中的文本。使用官方文档中提供的示例代码,我使用预先训练好的权重获得了良好的准确性。我打算使用OCR字符串来比较在文本中检测到的一些模式。为了能够创建应用程序,我正在使用Flask。 我想按行打印从OCR收到的字符串。此时,输出返回一个包含文本(单个单词)的图像。我希望只能按行打印从OCR接收到的字符串。我如何才能做到这一点? 代码: import matplotlib.pyplot as plt import keras_ocr # keras-ocr will automatically download pretrained # wei
浏览 95
提问于2021-07-08
得票数 2
1
回答
如何提高Android操作系统下OCR阅读器的图像质量
我制作了一个应用程序,它使用手机的摄像头拍摄一张照片,然后将这张照片(用Tesseract OCR)解析成一个字符串。 问题是,我获得的字符串非常难看,包含错误或不可读的字符。 我读过说,一个滤波器可以减少图像的噪音,可以改善OCR的结果。我搜索了其中的一些内容,并找到了,它包含了许多用Java编写的图像过滤器。问题是他们使用的是BufferedImage类,而不是Android中的。 有谁知道在android中执行此操作的其他库吗?
浏览 3
提问于2017-04-07
得票数 0
2
回答
tesseract不能用俄语
、
我的代码 private void button1_Click(object sender, EventArgs e) { if (openFileDialog1.ShowDialog() == DialogResult.OK) { textBox1.Clear(); var img = new Bitmap(openFileDialog1.FileName); //var ocr = new Tes
浏览 0
提问于2018-10-05
得票数 1
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
OCR模型训练
样本少字小,OCR怎么训练好?
Pytesseract,一个OCR识别利器的Python库!
潜意识训练工具制作材料库
手机照片太多找不到?腾讯微云支持OCR文字搜索
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券