标题: Enhancing User Interest based on Stream Clustering and Memory Networks in Large-Scale Recommender Systems 地址:https://arxiv.org/pdf/2405.13238 公司:腾讯
由于腾讯 | 流聚类和记忆网络对用户兴趣进行增强文章中存在一些错误,经作者指出,在这里进行一些修改,修改部分用下划线标注。
本文主要针对用户行为稀疏的问题,提出用户兴趣增强(UIE)的方法,从不同的角度使用基于流聚类和记忆网络生成的增强向量和个性化增强向量来增强用户兴趣,包括用户画像和用户历史行为序列。UIE不仅显著提高了兴趣稀疏用户的模型性能,而且显著提高了其他用户的模型效率。
主要是三部分,用户画像增强,消费行为增强和序列增强。三个部分的思路比较接近:
本文的基础模型采用PLE,进行多任务训练。如图所示,用户兴趣包括用户画像和用户历史行为序列,这决定了排名模型性能的上限。本文提出的用户兴趣增强(UIE)的方法,包括三个部分:用户画像增强(UPE)、用户消费行为增强(UCBE)和用户消费序列增强(UCSE),分别用于增强用户画像和用户消费行为序列。使用最相关的聚类和消费行为来补充额外的兴趣信息。所有的增强向量都被作为PLE模型的新特征。
在实际场景中,有很多用户是缺乏行为信息,只有稀疏的用户画像。UPE的作用是在其他类似用户的帮助下为用户推断缺失的哪些特征。UPE的基本思想是基于端到端流聚类和存储在记忆网络中的最相似质心来增强用户的用户画像。
UCBE的关键思想是使用用户的消费行为来选择记忆器网络1中最相关的质心。
UCSE的基本思想是利用流聚类生成的所有质心中最相似的质心来增强用户消费序列中包含的每个消费行为,然后基于注意力机制生成序列增强向量。