前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >ROC曲线绘制原理及如何用SPSS绘制ROC曲线

ROC曲线绘制原理及如何用SPSS绘制ROC曲线

原创
作者头像
悦影科技
修改于 2020-11-19 06:31:08
修改于 2020-11-19 06:31:08
5.2K0
举报

《本文同步发布于“脑之说”微信公众号,欢迎搜索关注~~》

ROC曲线(Receiver operating characteristic curve),即受试者工作特征曲线,主要用来评价某个指标对两类被试(如病人和健康人)分类/诊断的效果,以及寻找最佳的指标临界值使得分类效果最好。但是ROC曲线绘制的原理是什么,或者说如何一步步画出ROC曲线,以及如何用SPSS软件快速绘制出ROC曲线呢?对于很多新手朋友来说,对上述问题并不十分清楚。笔者这里对上述问题进行详细阐述,以期大家对ROC曲线有更深入的了解。

ROC曲线的主要用途

前面已经提到,ROC曲线的主要用途有两个:1)评价某个/多个指标对两类被试(如病人和健康人)分类/诊断的效果。通过画出某个指标的ROC曲线就可以很明确地看出其分类/诊断效果的好坏;另外,可以同时画出多个指标的ROC曲线并计算各自的AUC(area under ROC,ROC曲线下的面积),就可以知道哪个指标的分类/诊断效果更好。2)寻找最佳的指标阈值使得分类效果最佳。

ROC曲线的绘制原理

ROC曲线是如何绘制出来的呢?在此之前,我们先学习几个基本的概念。1)真阳性率(TPR, True positive rate):所有实际为阳性的样本被正确地判断为阳性的个数与所有实际为阳性的样本个数之比,TPR又称为Sensitivity(灵敏度);2)假阳性概率(FPR, False positive rate):所有实际为阴性的样本被错误地判断为阳性的个数与所有实际为阴性的样本个数之比,FPR等于1-Specificity。 ROC曲线其实就是以FPR为横坐标,TPR为纵坐标绘制出来的曲线。

下面以一个具体的例子来详细了解ROC曲线是如何绘制的。 如图1所示,假设有10个被试,分成两类,Class=1的表示阳性样本,Class=0的表示阴性样本,Value表示测量的某个指标值。 1)首先,依据Value值从大到小对这10个被试进行排序(图1已经是按此规则排过序的); 2)接下来,依次把Value值作为阈值(即阈值依次为0.9,0.8,0.7,…,0.05),当被试的Value值大于等于此阈值时被认为是阳性,否则此被试被认为是阴性。比如说,当以Value=0.6作为阈值,那么被试1,2,3,4被分类成阳性样本,其他被试被分类成阴性样本,据此,我们可以计算得到TPR=3/5,FPR=1/5。这样,我们就可以得到一组(TPR,FPR)值,依次把这10个Value值作为阈值,我们就可以得到10组(TPR,FPR)值,把这10组(TPR,FPR)绘制出来得到的曲线就是ROC曲线。

图1
图1

如何用SPSS绘制ROC曲线

当样本数据较多时,这样手算TPR和FPR比较麻烦,那么如何利用SPSS绘制ROC曲线呢?接下来,笔者通过实例操作教大家学会用SPSS绘制ROC曲线。

  1. 部分数据如图2所示:Group变量的值为0或1,表示两类被试,Value值表示测量的某个指标。
图2
图2
  1. 点击SPSS菜单栏中“分析—ROC曲线图”,如图3所示。
图3
图3
  1. 参数设置如图4,最后点击确定即可。
图4
图4
  1. ROC曲线如图5所示,其中AUC=0.832.
图5
图5
  1. ROC曲线对应的坐标点值如图6所示,这些坐标点表示不同阈值下得到的TPR和FPR.
图6
图6
  1. 如何寻找最佳的指标阈值使得分类效果最好?最佳的指标阈值一般处于ROC曲线的最左上角,即TPR最大同时FPR最小。一般用Youden’s index来确定最佳指标阈值,Youden’s index=TPR-FPR=TPR-Specifity+1。可以利用图6的坐标数据,计算每个坐标处的Youden’s index,当Youden’s index最大时对应的指标值即为最佳的指标阈值。

总结 本文主要对ROC曲线绘制的原理以及如何用SPSS软件快速绘制出ROC曲线进行了详细的阐述,希望对大家的研究有所帮助。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【统计】 ROC曲线(1) - 模型评估首选方案
ROC曲线,也称“受试者工作特征曲线”,主要是用于X对Y的预测准确率情况。最初ROC曲线是运用在军事上,现在更多应用在医学领域,判断某种因素对于某种疾病的诊断是否有诊断价值。
用户6317549
2019/12/17
2.8K0
【统计】 ROC曲线(1) - 模型评估首选方案
ROC,AUC,Precision,Recall,F1的介绍与计算
ROC曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣,ROC曲线称为受试者工作特征曲线 (receiver operating characteristic curve,简称ROC曲线),又称为感受性曲线(sensitivity curve),AUC(Area Under Curve)是ROC曲线下的面积。在计算ROC曲线之前,首先要了解一些基本概念。在二元分类模型的预测结果有四种,以判断人是否有病为例:
Tyan
2019/05/25
2.3K0
ROC曲线与AUC
对于0,1两类分类问题,一些分类器得到的结果往往不是0,1这样的标签,如神经网络,得到诸如0.5,0,8这样的分类结果。这时,我们人为取一个阈值,比如0.4,那么小于0.4的为0类,大于等于0.4的为1类,可以得到一个分类结果。同样,这个阈值我们可以取0.1,0.2等等。取不同的阈值,得到的最后的分类情况也就不同。
全栈程序员站长
2022/08/27
8180
ROC曲线与AUC
ROC曲线及AUC值[通俗易懂]
参考文献:【ROC曲线与AUC值】,【ROC,AUC最透彻的讲解(实例分析+matlab代码)】,【AUC计算方法与Python实现】,【AUC曲线计算方法及代码实现】
全栈程序员站长
2022/08/29
3.3K0
ROC曲线及AUC值[通俗易懂]
受试者工作特性曲线 (ROC) 的原理及绘制方式
受试者工作特性曲线 (Receiver Operating Characteristic, ROC) 曲线是生信分析中一种常用的性能评估方法,那么他背后的原理是什么呢?他为什么会被推荐作为二分类模型的优秀性能指标呢?
叶子Tenney
2024/05/28
3K0
受试者工作特性曲线 (ROC) 的原理及绘制方式
机器学习系列(二):理解ROC曲线
周五给学生讲课的时候,学生听得有点蒙,故写下这篇抢救一下。为了节省敲键盘的次数,下面部分内容来自维基百科。
明月AI
2021/10/28
1.3K0
机器学习系列(二):理解ROC曲线
ROC曲线
受试者工作特征曲线(receiver operating characteristic curve,简称ROC曲线),是比较两个分类模型好坏的可视化工具。
用户1483438
2022/01/02
8420
机器学习之分类性能度量指标 : ROC曲线、AUC值、正确率、召回率
同见博客:http://zhwhong.ml/2017/04/14/ROC-AUC-Precision-Recall-analysis/(对Latex公式支持更好) ---- 在分类任务中,人们总是喜欢基于错误率来衡量分类器任务的成功程度。错误率指的是在所有测试样例中错分的样例比例。实际上,这样的度量错误掩盖了样例如何被分错的事实。在机器学习中,有一个普遍适用的称为混淆矩阵(confusion matrix)的工具,它可以帮助人们更好地了解分类中的错误。 比如有这样一个在房子周围可能发现的动物类型的预测,这
zhwhong
2018/05/16
2.5K0
机器学习之分类性能度量指标 : ROC曲线、AUC值、正确率、召回率
在分类任务中,人们总是喜欢基于错误率来衡量分类器任务的成功程度。错误率指的是在所有测试样例中错分的样例比例。实际上,这样的度量错误掩盖了样例如何被分错的事实。在机器学习中,有一个普遍适用的称为混淆矩阵
用户1332428
2018/03/09
3.6K0
机器学习之分类性能度量指标 : ROC曲线、AUC值、正确率、召回率
一文读懂二元分类模型评估指标
在分类模型中,有很多关于模型性能的评估指标(evaluation metric),比如 accuracy、precision、recall、f1-score、roc、auc、prc 等等。这里慢慢梳理下这些指标的含义以及用途。
abs_zero
2018/04/17
3.2K0
一文读懂二元分类模型评估指标
ROC曲线详解
受试者工作特征曲线 (receiver operating characteristic curve,简称ROC曲线),又称为 感受性曲线(sensitivity curve)。得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一 信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而已。接受者操作特性曲线就是以假阳性概率(False positive rate)为 横轴,击中概率为纵轴所组成的坐标图,和被试在特定刺激条件下由于采用不同的判断标准得出的不同结果画出的曲线。
全栈程序员站长
2022/08/29
2.4K0
ROC曲线详解
模型评价指标—ROC曲线
对于分类模型,在建立好模型后,我们想对模型进行评价,常见的指标有混淆矩阵、F1值、KS曲线、ROC曲线、AUC面积等。
阿黎逸阳
2023/08/21
2.6K0
模型评价指标—ROC曲线
Precision, Recall, F-score, ROC, AUC
正样本就是使系统得出正确结论的例子,负样本相反。 比如你要从一堆猫狗图片中检测出狗的图片,那么狗就是正样本,猫就是负样本;反过来你若是想检测出猫的图片,那么猫就是正样本,狗就是负样本。
海天一树
2018/08/17
2.1K0
Precision, Recall, F-score, ROC, AUC
机器学习-ROC曲线:技术解析与实战应用
机器学习和数据科学在解决复杂问题时,经常需要评估模型的性能。其中,ROC(Receiver Operating Characteristic)曲线是一种非常有用的工具,被广泛应用于分类问题中。该工具不仅在医学检测、信号处理中有着悠久的历史,而且在近年来的机器学习应用中也显得尤为关键。
TechLead
2023/10/21
1.1K0
机器学习-ROC曲线:技术解析与实战应用
ROC及AUC计算方法及原理「建议收藏」
在大多数情况下不同类别的分类代价并不相等,即将样本分类为正例或反例的代价是不能相提并论的。例如在垃圾邮件过滤中,我们希望重要的邮件永远不要被误判为垃圾邮件,还有在癌症检测中,宁愿误判也不漏判。在这种情况下,仅仅使用分类错误率来度量是不充分的,这样的度量错误掩盖了样本如何被错分的事实。所以,在分类中,当某个类别的重要性高于其他类别时,可以使用Precison和Recall多个比分类错误率更好的新指标。
全栈程序员站长
2022/08/27
2.8K0
ROC及AUC计算方法及原理「建议收藏」
一份非常全面的机器学习分类与回归算法的评估指标汇总
读完机器学习算法常识之后,你已经知道了什么是欠拟合和过拟合、偏差和方差以及贝叶斯误差。在这篇给大家介绍一些机器学习中离线评估模型性能的一些指标。
abs_zero
2018/10/23
2.3K0
一份非常全面的机器学习分类与回归算法的评估指标汇总
评价指标 | ROC曲线和AUC面积理解
很多学习器是为测试样本产生一个实值或概率预测,然后将这个预测值与一个分类阈值进行比较,若大于阈值则分为正类,否则为反类。例如,神经网络在一般情形下是对每个测试样本预测出一个[0.0,1.0]之间的实值,然后将这个值与阈值0.5进行比较,大于0.5则判为正例,否则为反例。这个阈值设置的好坏,直接决定了学习器的泛化能力。
OpenCV学堂
2019/10/15
1.8K0
评价指标 | ROC曲线和AUC面积理解
ROC曲线不用愁,四种R包教你一步搞定!
前面我们介绍了一个对有害同义突变预测的方法PrDSM,可以发现,在对模型的分析中,大量的使用ROC对模型进行评估,今天我们就来介绍一下ROC的相关内容和两种ROC绘图方法:pROC、plotROC、ggROC和ROCR。
作图丫
2022/03/29
9.8K0
ROC曲线不用愁,四种R包教你一步搞定!
ROC曲线纯手工绘制
假如,我想根据ca125的值判定一个人到底有没有肿瘤,找了10个肿瘤患者,20个非肿瘤患者,都给他们测一下ca125,这样就得到了30个ca125的值。
医学和生信笔记
2023/02/14
8840
ROC曲线纯手工绘制
pr曲线 roc曲线_roc曲线与auc的含义
查准率,表示所有被预测为正类的样本(TP+FP)是真正类(TP)的比例: P = T P T P + F P P= \frac{TP}{TP+FP} P=TP+FPTP​ 查全率,表示所有真正类的样本(TP+FN)中被预测为真正类(TP)的比例: R = T P T P + F N R= \frac{TP}{TP+FN} R=TP+FNTP​
全栈程序员站长
2022/11/01
2.1K0
pr曲线 roc曲线_roc曲线与auc的含义
相关推荐
【统计】 ROC曲线(1) - 模型评估首选方案
更多 >
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文