题目: Adaptive Pointwise-Pairwise Learning-to-Rank for Content-based Personalized Recommendation
论文地址: https://dl.acm.org/doi/10.1145/3383313.3412229
代码: https://github.com/ygcinar/pointwise-pairwise-recommendation
排序学习被广泛应用于信息检索、推荐系统和自然语言处理领域,典型的排序学习方法首先学习一个打分函数,然后通过这些分数再对物品进行排序。根据其损失的种类排序学习可以分为三类:pointwise,pairwise和listwise。这三种方法均有其优点和不足。尽管之前有不少工作在异构损失上下工夫[1,2],但是这些方法都是简单的将pointwise和pairwise损失结合起来,优化时采用联合或者交替优化。在这篇论文中,作者主要关注pointwise和pairwise方法,解决了这样一个研究问题:能否设计一种新的替代损失从而将这两种损失最佳并且自适应的结合起来?
Pointwise排序直接评估用户对物品的相关分数,将相关性估计作为一个分类问题(针对二分,用户给物品的打分为0/1)或是有序回归问题(针对多级分数,比如用户给物品的打分为1-5分)。
其中为打分函数,为sigmoid函数,为模型参数。
Pairwise排序关注一对物品之间的相对顺序,以实现对这组物品的正确排序。
这部分是论文所提方法。Pairwise方法相比较于Pointwise方法对于标签不平衡较不敏感,对于标签噪声较敏感。而隐反馈数据本身就携带一些噪声,因为一些不相关的物品很有可能会被五点,而一些相关物品可能不会被用户点击到。因此作者提出一种学习策略,以便该模型可以针对每个三元组自行决定采用pointwise和pairwise方法中的哪一种。
其中为调整系数,当时,退化为,当时,退化为。
论文以使用隐反馈数据的个性化新闻推荐为场景。用户通过以下方式从其先前的交互(单击和未单击的项目)得到其特征表示:
其中为物品的嵌入,为用户在时刻点击过的物品嵌入的平均,为用户在时刻未点击过的物品嵌入的平均,为参数,为element-wise product。
利用简单的双线性形式计算出用户对物品的相关性得分:,其中为对角权重矩阵。
其中为对角权重矩阵,为对应的minibatch。
1、INR
2、Outbrain
将数据集按照时间顺序划分为训练集、验证集和测试集。其余具体实验设置详情请见原文。
通过表1可知,论文所提方法不仅极大的优于单独的pointwise、pairwise和listwise方法,同时还优于组合的pointwise-pairwise方法。
[1] Yu et al. 2017. Alternating Pointwise-Pairwise Learning for Personalized Item Ranking. CIKM ’17.
[2] Wang et al. 2016. PPP: Joint Pointwise and Pairwise Image Label Prediction. CVPR '16.