《本文同步发布于“脑之说”微信公众号,欢迎搜索关注~~》
ROC曲线(Receiver operating characteristic curve),即受试者工作特征曲线,主要用来评价某个指标对两类被试(如病人和健康人)分类/诊断的效果,以及寻找最佳的指标临界值使得分类效果最好。但是ROC曲线绘制的原理是什么,或者说如何一步步画出ROC曲线,以及如何用SPSS软件快速绘制出ROC曲线呢?对于很多新手朋友来说,对上述问题并不十分清楚。笔者这里对上述问题进行详细阐述,以期大家对ROC曲线有更深入的了解。
ROC曲线的主要用途
前面已经提到,ROC曲线的主要用途有两个:1)评价某个/多个指标对两类被试(如病人和健康人)分类/诊断的效果。通过画出某个指标的ROC曲线就可以很明确地看出其分类/诊断效果的好坏;另外,可以同时画出多个指标的ROC曲线并计算各自的AUC(area under ROC,ROC曲线下的面积),就可以知道哪个指标的分类/诊断效果更好。2)寻找最佳的指标阈值使得分类效果最佳。
ROC曲线的绘制原理
ROC曲线是如何绘制出来的呢?在此之前,我们先学习几个基本的概念。1)真阳性率(TPR, True positive rate):所有实际为阳性的样本被正确地判断为阳性的个数与所有实际为阳性的样本个数之比,TPR又称为Sensitivity(灵敏度);2)假阳性概率(FPR, False positive rate):所有实际为阴性的样本被错误地判断为阳性的个数与所有实际为阴性的样本个数之比,FPR等于1-Specificity。 ROC曲线其实就是以FPR为横坐标,TPR为纵坐标绘制出来的曲线。
下面以一个具体的例子来详细了解ROC曲线是如何绘制的。 如图1所示,假设有10个被试,分成两类,Class=1的表示阳性样本,Class=0的表示阴性样本,Value表示测量的某个指标值。 1)首先,依据Value值从大到小对这10个被试进行排序(图1已经是按此规则排过序的); 2)接下来,依次把Value值作为阈值(即阈值依次为0.9,0.8,0.7,…,0.05),当被试的Value值大于等于此阈值时被认为是阳性,否则此被试被认为是阴性。比如说,当以Value=0.6作为阈值,那么被试1,2,3,4被分类成阳性样本,其他被试被分类成阴性样本,据此,我们可以计算得到TPR=3/5,FPR=1/5。这样,我们就可以得到一组(TPR,FPR)值,依次把这10个Value值作为阈值,我们就可以得到10组(TPR,FPR)值,把这10组(TPR,FPR)绘制出来得到的曲线就是ROC曲线。
如何用SPSS绘制ROC曲线
当样本数据较多时,这样手算TPR和FPR比较麻烦,那么如何利用SPSS绘制ROC曲线呢?接下来,笔者通过实例操作教大家学会用SPSS绘制ROC曲线。
总结 本文主要对ROC曲线绘制的原理以及如何用SPSS软件快速绘制出ROC曲线进行了详细的阐述,希望对大家的研究有所帮助。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有