评估预测值与实际值之间差异的函数,通过最小化损失函数优化模型参数
计算预测的概率分布与真实概率分布之间的交叉熵来评估预测性能,常用作分类模型的损失函数
对于单个样本:
其中,y_i 是第 i 个样本的真实标签(0或1),\hat{y}_i 是模型对第 i 个样本预测为正类的概率
对于整个数据集,总损失:
其中,N 是样本总数
优点:
多分类问题中处理类别之间的互斥性
用于每个样本计算预测的类别概率分布与真实类别概率分布(one-hot编码)之间的交叉熵
评估分类模型性能,行表示实际类别,列表示预测类别,单元格的值表示实际类别被预测为对应预测类别的样本数量
正 | 负 | |
---|---|---|
预测为正 | TP | FP |
预测为负 | FN | TN |
已知分布:
P(A) = Probability of Positive Class (PC) 正类
P(not A) = Probability of Negative Class (NC) 负类
预测结果:
P(B) = Probability of Positive Prediction (PP) 预测为正
P(not B) = Probability of Negative Prediction (NP) 预测为负
指标:
从混淆矩阵中计算评估分类模型性能的指标,如准确率 Accuracy,精确率 Precision,召回率 Recall, F1 Score
参考:
https://sjster.github.io/introduction_to_computational_statistics/docs/index.html
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。