前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >机器学习100天(二十):020 分类模型评价指标-PR曲线

机器学习100天(二十):020 分类模型评价指标-PR曲线

作者头像
红色石头
发布2022-12-31 17:53:56
8480
发布2022-12-31 17:53:56
举报
文章被收录于专栏:红色石头的机器学习之路

机器学习100天!今天讲的是:分类模型评价指标-PR曲线!

《机器学习100天》完整目录:目录

上一节我们已经了解了混淆矩阵的概念,并掌握了精确率、召回率的计算公式,在这里。现在我们来学习 PR 曲线的概念。

如图中所示,P-R 曲线的 P 就是精确率(也称为查准率),R 就是召回率(也称为查全率)。以查全率作为横坐标,查准率作为纵坐标。对于同一个模型,通过调整分类阈值,可以得到不同的 P-R 值。这里的阈值就是判断正类的概率阈值,例如 0.5、0.8、0.3 等。不同的阈值,计算得到不同的 P 值和 R 值,然后将所有不同阈值下的 P-R 坐标点连接起来,就得到了 P-R 曲线。通常随着分类阈值从大到小变化,查准率减小,查全率增加。

比较两个分类器好坏时,显然是查得又准又全的比较好,也就是说 PR 曲线越往坐标(1,1)的位置靠近越好。若一个学习器的 P-R 曲线被另一个学习器完全”包住”,则后者的性能优于前者。如果存在交叉时,可以计算曲线与两个坐标轴围住的面积,面积越大,表明模型越好!也可以通过平衡点(即查准率=查全率的点,P-R 曲线与这条虚线的交点,称为 Break-Even Point,BEP)来判断。BEP 越靠近坐标(1,1),则模型越好。

在图中,基于 BEP 的比较,可以认为模型 A 优于模型 B 和模型 C 的。

好了,今天的内容到此结束!

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-12-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档