首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何计算OCR系统的置信度分数?

如何计算OCR系统的置信度分数?
EN

Stack Overflow用户
提问于 2020-07-17 11:55:28
回答 1查看 1K关注 0票数 1

我正在做一个OCR项目,我想知道如何计算我的OCR系统的置信度分数。

我有数字万用表图像。在设备的屏幕上有一些图像的测量结果。我想要认识到这些价值观。然而,根据我的研究,我不确定哪种OCR置信度计算技术适合我的系统。

据我所知,OCR置信度分数可以在字符、单词和句子方面进行计算。实际上,后两种方法建立在字符置信度分数的基础上。在我的例子中,按字符计算可能是错误的或不充分的。

例如,我有"40.245 V“文本。我得到了两种不同的识别结果,比如"40.247 V“和"70.245 V”。如果我没有错,两个结果都会有相同或接近的置信度分数。然而,"40.247 V“的预测是可以接受的,而"70.245 V”在我的情况下是不可接受的。

有没有办法计算这种情况下的置信度得分?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-07-23 12:13:55

在计算置信度时,您会生成置信度的加权平均值,以便为前几个字符赋予更多权重,而为最后一个字符赋予较少的权重。

代码语言:javascript
运行
AI代码解释
复制
#include <iostream>
#include <vector>
#include <stdio.h>
#include <stdlib.h>
#include <ctype.h>

using namespace std;

double getWeightedConfidence(vector<pair<char /* character */, double /*confidence of that character */>> word) {
    if (word.empty()) {
        return 1.0;
    }
    
    double confidence = 0;
    
    if (isdigit(word[0].first)) {
        // okay it is a number
        
        double weight = 1;
        double sumOfWeights = 0;
        for (const auto &c : word) {
            confidence += c.second * weight;
            sumOfWeights += weight;
            weight /= 10; // you can decay it by whatever number you want based on how much do you think next digit is less valueble then previous
        }
        
        confidence /= sumOfWeights;
    } else {
        // not a number - just calculate a normal average
        for (const auto &c : word) {
            confidence += c.second;
        }
        
        confidence /= word.size();
    }
    
    return confidence;
}

int main() {
    
    vector<pair<char, double>> number_with_first_digit_wrong;
    number_with_first_digit_wrong.emplace_back('7', 0.1);
    number_with_first_digit_wrong.emplace_back('4', 0.9);
    number_with_first_digit_wrong.emplace_back('6', 0.9);
    number_with_first_digit_wrong.emplace_back('2', 0.9);
    number_with_first_digit_wrong.emplace_back('.', 0.9);
    number_with_first_digit_wrong.emplace_back('9', 0.9);
    
    vector<pair<char, double>> number_with_last_digit_wrong;
    number_with_last_digit_wrong.emplace_back('7', 0.9);
    number_with_last_digit_wrong.emplace_back('4', 0.9);
    number_with_last_digit_wrong.emplace_back('6', 0.9);
    number_with_last_digit_wrong.emplace_back('2', 0.9);
    number_with_last_digit_wrong.emplace_back('.', 0.9);
    number_with_last_digit_wrong.emplace_back('9', 0.1);
    
    
    cout << getWeightedConfidence(number_with_first_digit_wrong) << " " << getWeightedConfidence(number_with_last_digit_wrong) << endl;
    
    return 0;
}

像这样简单的东西会给出结果:

0.179999 -当0.1是第一个数字的置信度(其他是0.9) 0.899993 -当0.1是最后一个数字的置信度(其他是0.9)

如果您认为某些位置比其他位置更有价值,则可以指定不同的权重。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62953451

复制
相关文章
cdr如何画分数、替代分数
今天群里有一位网友提问:谁知道cdr里面最后一个替代分数怎么弄?,尝试多种方法无果 打开cdr软件看了一下,鼠标放上去有一个提示 解决方法找一个适用的字体即可。如Kozuka Gothic Pr6N
2022/10/31
9500
cdr如何画分数、替代分数
Python定义计算矩阵转置的函数
定义计算矩阵转置的函数 1)使用循环进行转置 matrix = [[1, 2, 3, 4],[5, 6, 7, 8],[9, 10, 11, 12]]
kirin
2021/03/15
1.6K0
Python定义计算矩阵转置的函数
说明:zip 函数合并多个序列:多个序列的第一个元素合并成第一个元素,多个序列第二个元素合并成第二个序列…
全栈程序员站长
2022/09/01
1.3K0
Python定义计算矩阵转置的函数
如何用YOLO+Tesseract实现定制OCR系统?
在本文中,你将学习如何在深度学习的帮助下制作自己自定义的 OCR 来读取图像中的文字内容。我将通过 PAN-Card 图像的示例,带你学习如何进行文本检测和文本识别。但首先,让我们熟悉一下光学字符识别的过程。
AI算法与图像处理
2019/12/27
3.2K0
如何用YOLO+Tesseract实现定制OCR系统?
如何用YOLO+Tesseract实现定制OCR系统?
我们的第一个任务是从图像/文档中检测所需的文本。通常,根据需要,你不想阅读整个文档,而只想阅读一条信息,如信用卡号、Aadhaar/PAN 卡号、姓名、账单金额和日期等。检测所需文本是一项艰巨的任务,但由于深度学习,我们将能够有选择地从图像中读取文本。
AI研习社
2019/12/27
1.7K0
如何用YOLO+Tesseract实现定制OCR系统?
如何量化医学图像分割中的置信度?
来源:AI公园 深度学习爱好者本文约2700字,建议阅读6分钟本文介绍了利用变分推断进行分割置信度的预测。 在过去的十年里,深度学习在一系列的应用中取得了巨大的成功。然而,为了验证和可解释性,我们不仅需要模型做出的预测,还需要知道它在做出预测时的置信度。这对于让医学影像学的临床医生接受它是非常重要的。在这篇博客中,我们展示了我们在韦洛尔理工学院进行的研究。我们使用了一个基于变分推理技术的编码解码架构来分割脑肿瘤图像。我们比较了U-Net、V-Net和FCN等不同的主干架构作为编码器的条件分布采样数据。我们
数据派THU
2023/04/08
9370
如何量化医学图像分割中的置信度?
Python 递归计算分数数列
C语言的课后习题 求数列:2/1,3/2,5/3,8/5,13/8,21/13,...前50项的和 数列规律: 第二项的分母是【前一项分子】 第二项的分子是【前一项分子与分母的和】 from fractions import Fraction def fn(x): """ 计算每一项的值 """ time = 1 fz = 2 fm = 1 if x == 1:return fz / fm #if x == 1:return Fractio
py3study
2020/01/16
8580
Python 递归计算分数数列
33:计算分数加减表达式的值
33:计算分数加减表达式的值 总时间限制: 1000ms 内存限制: 65536kB描述 编写程序,输入n的值,求 1/1 - 1/2 + 1/3 - 1/4 + 1/5 - 1/6 + 1/7 - 1/8 + ... + (-1)n-1·1/n 的值。 输入输入一个正整数n。1 <= n <= 1000。输出输出一个实数,为表达式的值,保留到小数点后四位。样例输入 2 样例输出 0.5000 1 e<iostream> 2 #include<cstdio> 3 #include<cst
attack
2018/04/03
1.3K0
浅谈用Python计算文本BLEU分数
BLEU,全称为Bilingual Evaluation Understudy(双语评估替换),是一个比较候选文本翻译与其他一个或多个参考翻译的评价分数。
花落花飞去
2018/02/11
35.6K2
浅谈用Python计算文本BLEU分数
如何提升企业网站可信度
1、企业网站的合法性用户对企业网站的合法与否是对企业网站可否信任的第一客观断定准绳,因而企业网站应该最大水平地展现网站合法的根据,这些根据包括在本地公安局公共信息网络平安检查出备案的网站ICP号、企业组织机构代码证、税务注销证和消费运营答应证等权威证书标识。各证书标识能够增加超链接至相关机构查询页面,便于用户查证真假。
用户6049522
2019/09/11
8510
OCR大突破:Facebook推出大规模图像文字检测识别系统——Rosetta
作者 | Fedor Borisyuk,Albert Gordo,Viswanath Sivakumar
AI科技大本营
2018/09/28
2.6K0
OCR大突破:Facebook推出大规模图像文字检测识别系统——Rosetta
使用图计算系统实现研报关键词权重分数计算性能提升百倍以上
•一、数据模型•二、TF-IDF算法•三、计算过程 •3.1 指定研报和关键词计算TF-IDF分数 •3.2 优化3.1中的查询 •3.3 将3.2中查询封装为过程 •3.4 在集群中节点执行查询 •3.5 将计算结果写入MySQL •3.6 将计算结果写入图数据库 •3.7 分布式计算系统•四、总结
马超的博客
2022/09/02
6230
使用图计算系统实现研报关键词权重分数计算性能提升百倍以上
【研究方法】如何提高问卷调查的信度和效度?
一、问题的提出 问卷调查作为收集社会资料的一种有效形式,被政府和学者抬高于较高的地位。从调查内容看,不仅有了解人们对于社会中一些事件的看法,而且有对于一个理论假设或现实问题的证明或印证。从调查者的学科
用户1756920
2018/06/20
3.9K0
LeetCode 算法 | 如何拆分数组?
今天给大家分享的 LeetCode 算法题是和数组相关,关于如何拆分数组的,来一起夯实一下算法内功。
好好学java
2019/12/31
9580
Unity 实现一个分数系统
项目中经常遇到分数统计的需求,例如我们执行了某项操作或做了某个题目,操作正确则计分,相反则不计分失去该项分数,为了应对需求需要一个分数统计系统。
CoderZ
2022/08/29
5000
Unity 实现一个分数系统
Linux系统平均负载是如何计算的?[通俗易懂]
关于负载的计算,它的结果是包含有小数的一个浮点数,内核中是不能使用float变量的,那么这里就采用了一个整型变量的低11位来表示小数部分。那么对于数值1来说,它就是FIXED_1,也就是需要对1进行左移11bit。实际上此时这个整型变量保存的值是1024。
全栈程序员站长
2022/10/02
2.4K0
如何理解转置卷积(transposed convolution)
转置卷积也被称为反卷积,常被用用于CNN中的上采样操作,比如分割任务,或GAN网络中。反卷积并不是常规卷积的完全逆操作,反卷积也起不到根据输出特征以及对应的卷积核,恢复原始输出的作用,它最多的作用就是有可学习参数的上采样操作,仅此而已。 同时,反卷积操作并没有把正向卷积输出,对应的卷积核拿过来做转置使用,而是多了几个卷积核而已。 此外,即便是把正向卷积输出对应的卷积核拿过做反卷积,它也恢复不出来原来的参数,恢复原来参数这种操作看起来并没有太大意义,因为只是想做上采样而已。 这里与常规卷积的区别主要体现在:
chaibubble
2021/02/04
1.7K0
网站如何快速全页置灰?
实现网站全页面快速置灰,可以使用一个 css 属性,加到 html 标签上,即可快速实现
蓓蕾心晴
2022/12/07
4980
云计算如何实现自治系统
由于持续蔓延的疫情阻碍了全球的经济发展,也对企业采用云计算产生显著影响。企业需要为获得更多自治IT资源做好准备。
静一
2020/06/17
1.2K0
卷积,特征图,转置卷积和空洞卷积的计算细节
最近在做姿态估计的项目,在定制和实现卷积网络的时候发现自己对里面的一些计算细节还不够了解,所以整理了该文章,内容如下:
用户1332428
2018/07/26
2.2K0
卷积,特征图,转置卷积和空洞卷积的计算细节

相似问题

如何计算神经网络预测的置信度分数

4225

如何在亚马逊网络服务SageMaker GroundTruth中计算置信度分数?

10

计算分数/排名系统的分数(PHP / MySQL)

34

来自Google Vision API的OCR置信度得分

21

Amazon操作未返回置信度分数

111
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档