Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Venn-Abers 预测器 - plus studio

Venn-Abers 预测器 - plus studio

作者头像
plus sign
发布于 2024-02-29 01:00:49
发布于 2024-02-29 01:00:49
1670
举报
文章被收录于专栏:个人博客个人博客

Venn-Abers 预测器

Venn-Abers 预测器 https://arxiv.org/pdf/1211.0025.pdf

是一种基于Venn预测器的新的专注于二元预测问题的统计方法。它们生成的是概率类型的预测,这些预测在标准假设下(即观察是从同一分布独立生成的)是很好校准的。这种预测器的一个关键特点是它们输出的是概率区间而不是单一的概率点。Venn-Abers 预测器可以与其他模型结合使用。

Venn-Abers 预测器 输出的分数映射到经过良好校准的概率。

  • 输入(Input)
    • 数据特征(Data Features): 模型抽出来的特征
    • 目标变量(Target Variable): 监督学习的目标
  • 输出(Output)
    • 概率预测(Probability Predictions): Venn-Abers预测器输出的是概率对,而不是单一的概率值。这意味着对于每个预测实例,它会给出一个概率范围,而不是一个具体的概率点。
    • 校准质量评估(Calibration Quality Assessment): 此外,还可以通过预期校准误差(ECE)等指标来评估预测的校准质量,这有助于理解模型在不同类别上的预测准确度。

have a try https://github.com/ptocca/VennABERS

代码语言:text
AI代码解释
复制
calibrPts = [(1,1,2),(2,2,4),(3,3,0),(4,4,2),(5,5,1),(6,6,5),(7,7,7)]
testScores = [1.5,2.5,3.5,4.5,5.5,6.5]

p0,p1 = ScoresToMultiProbs(calibrPts,testScores)
print(p0, p1)
代码语言:text
AI代码解释
复制
[0.5        1.         1.66666667 2.33333333 3.         3.75      ] [1. 1. 1. 1. 1. 1.]

两个列表分别代表对应的代表上限和下限。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-1-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
等渗回归和PAVA算法
等渗回归是很少被谈论但肯定是最酷的回归技术之一。我之所以说“很少谈论”,是因为与线性回归不同,它不经常被讲授或使用。等渗回归做出一个更笼统的假设,即最能代表数据的函数是单调的,而不是线性的(是的,线性也是单调的,反之亦然)。
磐创AI
2021/04/21
4K1
等渗回归和PAVA算法
用户增长 - BG/NBD概率模型预测用户生命周期LTV(二)
目前该系列的几篇: 用户增长——CLV用户生命周期价值CLTV 笔记(一) 用户增长 - BG/NBD概率模型预测用户生命周期LTV(二) 用户增长——Cohort Analysis 留存分析(三)
悟乙己
2021/12/07
1.5K0
用户增长 - BG/NBD概率模型预测用户生命周期LTV(二)
叫我如何相信你?聊一聊语言模型的校准
在实际的NLP业务场景中,我们经常遇到一个问题就是调阈值。因为我们需要把模型输出层sigmoid函数或者softmax函数给出的连续的预测概率转化成离散输出,所以需要一个阈值来决定你如何相信你的模型。特别是当应对的领域(domain)复杂多样,而训练数据来源比较单一的时候,如何选择一个比较平衡的阈值是一个尤为棘手的问题。
朴素人工智能
2020/04/21
1.5K0
叫我如何相信你?聊一聊语言模型的校准
基于Venn-Abers预测器的系统日志异常检测方法_顾兆军 - plus studio
收集日志信息、日志解析和日志的特征化提,包括收集日志信息、日志解析和日志的特征化提取。
plus sign
2024/02/29
1520
基于Venn-Abers预测器的系统日志异常检测方法_顾兆军 - plus studio
临床预测模型-静态诺模/列线图(Nomogram)+校准曲线(Calibration)分析学习
诺模图(Nomogram),也被称为列线图,是一种图形化的计算工具,用于通过将多个变量的影响集成到一个单一的数值评分上,以预测某个特定事件的概率。这种工具常用于医学领域,尤其是在肿瘤学中,用于评估患者的疾病预后、生存率等。
凑齐六个字吧
2024/11/10
4870
临床预测模型-静态诺模/列线图(Nomogram)+校准曲线(Calibration)分析学习
Python实战|利用生存分析预测用户流失周期(二)
Cox风险比例模型是用户流失分析中较为常用的方法,该模型不仅可以预测用户是否会流失,还能预测用户何时流失,下面一起来看看Cox风险比例模型如何预测用户流失。
数据万花筒
2021/07/29
1.5K0
字段级概率校准,助力推荐算法更精准!
丨导语 一年一度的国际顶级学术会议万维网大会 (The Web Conference, 即 WWW-2020) 于 4 月 20 日至 4 月 24 日在线上成功召开。WWW-2020 收到来自全球五十多个国家和地区的超过 1500 篇论文投稿,仅录用长文 219 篇,录用率 19%。其中,由腾讯TEG数据平台部,与中科院计算所、清华大学合作研究的成果《Field-aware Calibration: A simple and empirically strong method for reliable
腾讯大数据
2020/05/13
2.2K0
Calibration: 一个工业价值极大,学术界却鲜有研究的问题!
在实际的工业应用中,当模型的准确性无法达到预期的标准时,通常思考采用提高模型决策的阈值。而这种方法在神经网络上不一定适用。本文介绍了一篇来自2017年的ICML顶会论文,关于让模型的softmax输出能真实的反映决策的置信度,也就是Calibration问题。
AI算法与图像处理
2021/01/20
1.6K0
Calibration: 一个工业价值极大,学术界却鲜有研究的问题!
DPDDI:用于药物-药物相互作用的深度预测器
今天给大家介绍BMC Bioinformatics期刊的一篇文章,”DPDDI: a deep predictor for drug-drug interactions”。作者开发了DPDDI模型,在不考虑药物化学和生物特性的情况下,仅使用药物-药物(DDI)网络作为输入,便可预测潜在的DDI,还可用于检测药物副作用、指导联合用药等。
DrugAI
2021/02/02
1.7K0
DPDDI:用于药物-药物相互作用的深度预测器
纯干货:Box Size置信度偏差会损害目标检测器
无数应用依赖于目标检测器的可靠置信度估计的准确预测。然而,众所周知,包括目标检测器在内的神经网络会产生错误校准的置信估计。最近的工作甚至表明,检测器的置信度预测在目标大小和位置方面存在偏差,但目前尚不清楚这种偏差与受影响的目标检测器的性能有何关系。
计算机视觉研究院
2022/01/27
5280
纯干货:Box Size置信度偏差会损害目标检测器
每日学术速递12.24
1.On Calibration in Multi-Distribution Learning
AiCharm
2024/12/24
1320
每日学术速递12.24
斯坦福吴恩达团队提出NGBoost:用于概率预测的自然梯度提升
自然梯度提升(NGBoost / Natural Gradient Boosting)是一种算法,其以通用的方式将概率预测能力引入到了梯度提升中。预测式不确定性估计在医疗和天气预测等很多应用中都至关重要。概率预测是一种量化这种不确定性的自然方法,这种模型会输出在整个结果空间上的完整概率分布。梯度提升机(Gradient Boosting Machine)已经在结构化输入数据的预测任务上取得了广泛的成功,但目前还没有用于实数值输出的概率预测的简单提升方案。NGBoost 这种梯度提升方法使用了自然梯度(Natural Gradient),以解决现有梯度提升方法难以处理的通用概率预测中的技术难题。这种新提出的方法是模块化的,基础学习器、概率分布和评分标准都可灵活选择。研究者在多个回归数据集上进行了实验,结果表明 NGBoost 在不确定性估计和传统指标上的预测表现都具备竞争力。
机器之心
2019/10/15
6250
斯坦福吴恩达团队提出NGBoost:用于概率预测的自然梯度提升
纯干货:Box Size置信度偏差会损害目标检测器(附源代码)
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 源代码获取|回复“CB”获取源代码 计算机视觉研究院专栏 作者:Edison_G 检测器的置信度预测在目标大小和位置方面存在偏差,但目前尚不清楚这种偏差与受影响的目标检测器的性能有何关系。 一、前言 无数应用依赖于目标检测器的可靠置信度估计的准确预测。然而,众所周知,包括目标检测器在内的神经网络会产生错误校准的置信估计。最近的工作甚至表明,检测器的置信度预测在目标大小和位置方面存
计算机视觉研究院
2022/06/20
4020
纯干货:Box Size置信度偏差会损害目标检测器(附源代码)
QQ 浏览器搜索相关性实践
搜索相关性主要指衡量Query和Doc的匹配程度,是信息检索的核心基础任务之一,也是商业搜索引擎的体验优劣最朴素的评价维度之一。本文主要介绍团队在相关性系统、算法方面的实践经历,特别是在看点搜索、搜狗搜索两个大型系统融合过程中,在系统融合、算法融合、算法突破方面的一些实践经验,希望对搜索算法、以及相关领域内的同学有所帮助及启发。 作者:jesangliu,腾讯 PCG 应用研究员 1、前言 搜索相关性主要指衡量Query和Doc的匹配程度,是信息检索的核心基础任务之一,也是商业搜索引擎的体验优劣最朴素的评价
腾讯技术工程官方号
2023/01/18
1.5K0
QQ 浏览器搜索相关性实践
收集 301 医院 451 名老年冠心病患者数据,湖北麻城人民医院推出机器学习模型,准确预测患者一年内死亡率
内容一览:据国际糖尿病联盟 (IDF) 统计,2021 年中国糖尿病患者数量占全球 26%。而糖尿病患者血糖长期失控,有极高风险引起冠心病等并发症。近期,湖北省麻城市人民医院研究人员分析比较了多种模型,并用其中表现最优的机器学习模型,预测了中国老年冠心病合并糖尿病或糖耐量受损患者一年内死亡率为 26.83%。
HyperAI超神经
2023/08/31
2780
收集 301 医院 451 名老年冠心病患者数据,湖北麻城人民医院推出机器学习模型,准确预测患者一年内死亡率
朴素贝叶斯算法优化与 sklearn 实现
这显然是不正确的,本文,我们就来解决这个问题,同时对算法进行优化并使用 sklearn 来实现算法的实践。
用户3147702
2022/06/27
6530
朴素贝叶斯算法优化与 sklearn 实现
通过准确性、可解释性、校准度和忠实度,对ChatGPT的能力进行全面评估
本文主要评估了ChatGPT这种大型语言模型在信息提取方面的能力,作者使用了7个细粒度的信息提取任务来评估ChatGPT的性能、可解释性、校准度和可信度。
zenRRan
2023/08/21
5420
通过准确性、可解释性、校准度和忠实度,对ChatGPT的能力进行全面评估
ICRA 2021| 具有在线校准功能的高效多传感器辅助惯性导航系统
作者:Woosik Lee, Yulin Yang, and Guoquan Huang
计算机视觉
2021/07/05
1.2K0
NatGenet | 细胞注释新工具,使用 popV 在单细胞数据中进行细胞类型标签的共识预测
[ol]- 1. retrain—it trains all methods from scratch and stores the classifier to reuse them on other datasets. This hugely benefits from a GPU to train the scVI and scANVI algorithms as well as the OnClass algorithm. - 2. inference—it uses pretrained methods to classify query and reference cells; computes a joint UMAP embedding of query and reference cells and by default uses all eight methods; and trains scVI and scANVI models for 20 epochs using scArches query embedding19. - 3. fast—it uses pretrained methods to classify only query cells; computes a UMAP embedding of query cells if enabled; skips Scanorama and BBKNN data integration as those recompute an embedding instead of projecting cells into an existing embedding; and trains scVI and scANVI models for 1 epoch using scArches query embedding.
生信菜鸟团
2024/12/20
4920
NatGenet | 细胞注释新工具,使用 popV 在单细胞数据中进行细胞类型标签的共识预测
概率校准
使用sklearn自动生成二分类数据集,划分训练集、验证集和测试集对不同的分类器,画出可靠性曲线在训练集上:在验证集上如何进行概率校准(probability calibration)方法1:Platt Scaling方法2:Isotonic Regression 保序回归scikit-learn 提供了执行概率预测校准的两种方法的API评价:Brier score
用户3577892
2020/06/10
2.8K0
推荐阅读
相关推荐
等渗回归和PAVA算法
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档