前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >推荐系统常用评价指标

推荐系统常用评价指标

作者头像
hotarugali
发布2023-05-16 20:16:00
1K0
发布2023-05-16 20:16:00
举报

1. 基本概念

  • 正样本:预测标签与真实标签一致的样本;
  • 负样本:预测标签与真实标签不一致的样本;
  • 困难样本:预测值与实际标签误差较大的样本;
  • 简单样本:预测值与实际标签误差较小的样本。

2. AUC

AUC: Area Under ROC Curve,同目标检测中的 AUC 指标

  • 理解:随机抽取一对正负样本,AUC 是把正样本预测为 111 的概率大于把负样本预测为 111 的概率的概率。
  • 意义:当 AUC 为 0.50.50.5 时,模型没有分类能力,完全是随机猜测;AUC 越大说明模型越具有分类能力。

3. GAUC

GAUC: Group AUC,先计算各个用户自己的 AUC,然后取加权平均。公式如下:

\mathrm{GAUC} = \frac{\sum_{ui} w_{ui} \cdot \mathrm{AUC}_{ui}}{\sum w_{ui}}

4. HR@K

HR@K: Hit Ratio,即命中率,数学公式如下:

\mathrm{HR@K} = \frac{\sum_{i}^{K} hit(i)}{N}

分母表示所有的测试集合大小,分子表示每个用户 top-K 推荐列表中属于测试集合的个数总和。

5. MRR

MRR: Mean Reciprocal Rank,即平均倒数排名,其反映的是我们找到的这些 item 是否摆在用户更明显的位置,强调位置关系,顺序性。数学公式如下:

\mathrm{MRR} = \frac{1}{N} \sum_{i=1}^N \frac{1}{p_i}

其中,

N

表示推荐次数,

p_i

表示用户真实访问的 item 在推荐列表中的位置,如果不在推荐列表中,则

p

为无穷大,

\frac{1}{p}

0

6. NDCG

  • G: Gain,表示一个列表中 item 的相关性分数,
rel(i)

表示

\mathrm{item}(i)

相关性得分。

\mathrm{Gain} = rel(i)
  • CG: Cumulative Gain,表示对前
K

个 item 的 Gain 进行累加。

\mathrm{CG_K} = \sum_i^K rel(i)

CG 只是单纯累加相关性,不考虑位置信息。

  • DCG: Discounted Cumulative Gain,考虑排序顺序的因素,使得排名靠前的 item 增益更高,对排名靠后的 item 进行折损。
\mathrm{DCG} = \sum_{i}^K \frac{rel(i)}{\log_2 (i+1)}
  • IDCG: Ideal Discounted Cumulative Gain,最理想的排序列表对应的 DCG。
  • NDCG: Normalized Discounted Cumulative Gain,即归一化的折损累计增益。
\mathrm{NDCG} = \frac{\mathrm{DCG}}{\mathrm{IDCG}}
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-03-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 基本概念
  • 2. AUC
  • 3. GAUC
  • 4. HR@K
  • 5. MRR
  • 6. NDCG
相关产品与服务
腾讯云服务器利旧
云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档