部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >利用对话式推荐解决用户冷启动问题

利用对话式推荐解决用户冷启动问题

作者头像
张小磊
发布于 2021-04-01 22:28:53
发布于 2021-04-01 22:28:53
1.3K0
举报

转载:PaperWeekly

链接:mp.weixin.qq.com/s/627wrUxkAPoRlO0YFxRcoA

仅作为学术交流分享


推荐系统冷启动通常分为三类,即用户冷启动、物品冷启动还有系统冷启动。无论那种冷启动都因为只有较少的数据和特征来训练模型,所有需要不同的技术方案来提升推荐效果。另外冷启动结合产品方案可以加速冷启动的过程。

其中用户冷启动的问题对于移动互联网基于内容推荐产品中非常重要,不管是新产品还是体量很大的产品,都存在大量新用户和低活用户,即冷启动用户。这部分用户是 DAU 增长的关键点,但这些用户交互数据很少甚至没有,如何快速找到这部分用户的兴趣,是用推荐系统需要解决的关键问题。

快手和中科大发表在 TOIS (ACM Transactions on Information Systems) 上的最新工作提出融合物品(视频)和属性的统一框架,用汤普森采样结合对话式的方法为冷启动用户做推荐。对话式推荐能够通过向用户提问来快速获得用户兴趣,而汤普森采样能够保持探索-利用的平衡,这两点均有助于系统尽快地探索到冷启动用户的兴趣并利用已有知识进行推荐。

论文标题:

Seamlessly Unifying Attributes and Items: Conversational Recommendation for Cold-Start Users

论文链接:

https://arxiv.org/abs/2005.12979

本文着重研究两个关键点:

1. 如何做到探索-利用的平衡。在推荐系统中,探索(Exploration)是指去主动寻找未知的用户潜在的兴趣;利用(Exploitation)是指根据已有的经验去估计用户当前的兴趣并做出推荐。由于缺乏用户行为历史数据,在为冷启动用户做推荐时保持探索和利用的平衡尤为重要——我们既要尽快探索用户对不同商品的兴趣,又要尽可能利用当前已经获得的知识来做出合适的推荐。这样才能尽可能吸引新用户和低活用户,并提高留存率。

2. 对话式推荐方法。对话式推荐在推荐系统领域近来得到广泛的关注。对话式推荐系统中的“对话”模块能够直接向用户提问,并期望通过用户的回答显式地获得用户的兴趣。提问的形式可以多种多样,本文考虑对物品的属性进行提问。例如,在快手短视频推荐的场景中,新用户的应用主界面会收到一个弹窗。

弹窗中列举了一系列短视频类型(属性标签),并引导用户去选择自己喜欢的视频类型。相比于间接地从历史交互数据中进行推断,这些主动选择的属性标签可以为推荐系统提供更准确,更直接的用户兴趣信息,并帮助提供更好的推荐。在对话式推荐中,主要有三个核心的策略问题:(1)问什么问题;(2)推荐什么物品;(3)当前是问问题还是做推荐。

方法介绍

文章提出了一个统一的框架 ConTS,把物品和属性建模到一个空间中,利用改进的汤普森采样算法 [1] 保持探索和利用的平衡,并使用一个统一的打分函数来统一解决对话式推荐中的三个核心问题。

具体来说,文章研究用户和推荐系统间的多轮对话推荐场景。首先用非冷启动用户的历史交互数据去分布训练一个 FM 模型,得到所有历史用户,物品和属性的 embedding 并为冷启动用户做参数初始化。

在每轮对话开始之前,首先从一个多维高斯分布中进行采样得到用户当前的 embedding,利用得到的 embedding 和用户当前已知喜欢的属性对所有物品和属性进行打分。

如果得分最高的是物品,就向用户推荐分数最高的前 k 个物品;如果得分最高的是属性,就向用户询问对于这个属性的喜好。如果用户拒绝了推荐的物品或者提问的属性,在把拒绝的物品(属性)从候选池中剔除后继续对话过程。

如果用户接受了推荐的物品,代表推荐成功并结束对话。如果用户喜欢提问的属性,那么记录下该属性,并把当前候选池中所有不含有该属性标签的物品剔除。此外,如果在超过一个最大对话轮数(如 15 轮)用户还未获得满意的推荐,认为用户会失去耐心并直接退出当前对话。

本文把对话式推荐中所有的物品和属性进行统一建模,用一个相同的打分函数来决定所有的策略问题。实验证明,这种统一建模的方式相比之前一些手动设置对话策略的工作(如 ConUCB [2])更加智能和鲁棒。此外,我们在打分函数中引入了对用户喜欢的属性信息的建模,使得模型能够更好地利用用在对话过程中直接获得的用户兴趣。

下面的式子就是我们的打分函数,其中 是采样得到的用户 embedding, 是物品/属性的 embedding, 是在对话中获得的用户喜欢的属性集合, 是这些属性的 embedding。

每轮推荐或者提问之后,会根据用户的反馈更新用户 embedding 服从的高斯分布的参数,具体更新方式如下:

文章把汤普森采样运用在对话式推荐中,并更具加入的初始化过程和用户喜欢属性信息建模调整了参数的更新方式。汤普森采样是一种经典的 Bandit 算法,目的是在推荐过程中保持探索-利用的平衡,使得在一定时间内的收益损失有一个理论的上界。

在这里假设用户的 embedding 服从一个多维高斯分布 ,并不断利用用户反馈更新其均值 和协方差 。

实验效果

文章在两个经典数据集 Yelp,LastFM 和一个从快手平台上收集的数据集 Kuaishou 上进行了详尽的实验。首先把 ConTS 和几个现有方法做比较,并进行了消融实验。结果如下:

表格中比较的是 15 轮的推荐成功率和平均推荐成功轮数,图中展示的 1-15 轮的推荐成功率的相对差值。可以看到在每个指标上 ConTS 都显著优于已有的方法。三个消融实验分别去掉了模型中初始化,用户喜欢属性建模和探索模块,结果验证了这些设计对模型表现的重要性。

此外,我们还探究了不同的 Bandit 方法——汤普森采样和上置信界算法对我们模型的影响。我们用同样的方式把上置信界算法进行改进以适应对话式推荐场景,并于 ConTS 进行比较,结果如下:

可以看到汤普森采样在我们的场景下表现更好。文章还研究了在最大对话轮数更小(7 和 10)下的情况,ConTS 仍然显著优于其他方法;探究了在不同程度冷启动条件下模型之间的差异,结果表明 ConTS 适合冷启动场景而其他一些方法如 EAR [3] 适合热启动场景。最后用三个案例分析探究了不同方法在实际对话过程中的策略差异。

结论

如何为冷启动用户做推荐是学术界和工业界研究的热点问题之一。这篇论文利用对话式推荐结合汤普森采样的方式,提出了一个融合物品和属性的统一模型来解决该问题。在保持探索-利用平衡的同时,用对话的方式直接快速地获得用户的兴趣,以此帮助系统更好地为冷启动用户进行推荐。实验结果表明,该模型相对现有方法具有较大优势。

推荐阅读

强化学习推荐系统的模型结构与特点总结

如何解决推荐中的Embedding冷启动问题?

WWW2021推荐系统论文集锦(附下载)

参考文献

[1] Shipra Agrawal and Navin Goyal. 2013. Thompson sampling for contextual bandits with linear payoffs. In ICML.127–135.

[2] Xiaoying Zhang, Hong Xie, Hang Li, and John Lui. 2020. Conversational Contextual Bandit: Algorithm and Application.In WWW.

[3] Wenqiang Lei, Xiangnan He, Yisong Miao, Qingyun Wu, Richang Hong, Min-Yen Kan, and Tat-Seng Chua. 2020.Estimation–Action–Reflection: Towards Deep Interaction Between Conversational and Recommender Systems. In WSDM.

喜欢的话点个在看吧?

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-03-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与推荐算法 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
推荐系统中的冷启动和探索利用问题探讨
作者:文辉 | 达观数据 量子位 已获授权编辑发布 1.前言 互联网技术和大数据技术的迅猛发展正在时刻改变我们的生活,视频网站、资讯app、电商网站对于推荐系统而言,每天都有大量的活跃用户在不断的产生海量的用户行为,同时,每天又都产生大量的新增PGC或者UGC内容(如小说、资讯文章、短视频等)。 从推荐系统的角度来看,系统每时每刻都面临大量的新旧用户、新旧物品和大量的用户行为数据,对于用户,我们需要对要用户进行建模,去刻画用户的肖像和兴趣。 然而我们常常面对的情况是用户的行为是稀疏的,而且可能存在比例不一的
量子位
2018/03/28
3.3K0
推荐系统中的冷启动和探索利用问题探讨
一文梳理冷启动推荐算法模型进展
如何给新加入的用户推荐可能感兴趣的物品?如何将新上架的物品推荐给潜在的用户?这两个问题分别是用户冷启动和物品冷启动,统称为冷启动推荐。冷启动问题是推荐系统中极具挑战的一个问题,也是一个业界学术界同时高度关注的问题,本期为大家分享一些冷启动推荐算法层面的思路。
张小磊
2021/08/06
1.9K0
推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结【冷启动召回、复购召回、用户行为召回等算法实战】
内容化这几年越来越成为电商的重点,用户来到网购的时候越来越不局限在只有明确需求的时候,而更多的是没有明确需求的时候,就像是逛街一样。逛逛就是在这样的背景下诞生的内容化产品,打造出有用、有趣、潮流、奇妙、新鲜的内容,为消费者提供全新的内容消费体验。在这个场景下的内容召回有很多问题需要探索,其中主要的特点和挑战有:
汀丶人工智能
2023/02/25
2.5K0
推荐算法的三大研究热点
👆点击“博文视点Broadview”,获取更多书讯 推荐系统领域还存在着很多问题有待研究,这些问题将对推荐系统的应用起到重要影响。 下面介绍三个关键热点问题:基于对话的推荐、因果推荐和常识推荐。 01 基于对话的推荐 传统的推荐算法与用户的交互较为缺乏,难以及时有效地把握用户兴趣。基于对话的推荐系统(Conversational Recommender System,CRS)能够通过与用户深入互动来了解用户兴趣,成了推荐系统领域一个新的研究热点。基于对话的推荐系统的核心是用户与推荐系统的在线交互,即将
博文视点Broadview
2022/08/26
4540
推荐算法的三大研究热点
[推荐系统读书笔记]推荐系统冷启动问题
推荐系统需要根据用户的历史行为和兴趣预测用户未来的行为和兴趣,因此大量的用户行为数据就称为推荐系统的重要组成部分和先决条件。很多在开始阶段就希望有个性化推荐应用的网站来说,如何在没有大量用户数据的情况下设计个性化推荐系统并且让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动问题。
用户1631856
2018/12/06
1.3K0
推荐系统[二]:召回算法超详细讲解[召回模型演化过程、召回模型主流常见算法(DeepMF_TDM_Airbnb Embedding_Item2vec等)、召回路
召回这里稍微有些复杂,因为召回是多路的。首先我们要解释主路和旁路的差别,主路的意义和粗排类似,可以看作是一个入口更大,但模型更加简单的粗排。主路的意义是为粗排分担压力。但是旁路却不是这样的,旁路出现的时机往往是当主路存在某种机制上的问题,而单靠现在的这个模型很难解决的时候。举个例子,主路召回学的不错,但是它可能由于某种原因,特别讨厌影视剧片段这一类内容,导致了这类视频无法上升到粗排上。那这样的话整个系统推不出影视剧片段就是一个问题。从多路召回的角度来讲,我们可能需要单加一路专门召回影视剧的,并且规定:主路召回只能出3000个,这一路新加的固定出500个,两边合并起来进入到粗排中去。这个栗子,是出现旁路的一个动机。
汀丶人工智能
2023/02/22
3.5K0
推荐算法的三大研究热点
传统的推荐算法与用户的交互较为缺乏,难以及时有效地把握用户兴趣。基于对话的推荐系统(Conversational Recommender System,CRS)能够通过与用户深入互动来了解用户兴趣,成了推荐系统领域一个新的研究热点。基于对话的推荐系统的核心是用户与推荐系统的在线交互,即将通过用户与推荐系统的对话交互过程获得用户的反馈,并将用户反馈融入推荐模型中,期望更好地理解用户的兴趣并提升推荐的准确性。
张小磊
2022/10/31
8360
如何解决推荐系统中的Embedding冷启动问题?
时至今日,深度学习的经典知识几乎已经是“显学”了,但是在实现深度学习推荐系统的过程中,还是充满了无数的细节和坑。所以接下来几篇文章会专门跟大家总结讨论课程中大家问题最多的,最感兴趣的话题。
张小磊
2021/03/16
2.6K0
如何解决推荐系统中的Embedding冷启动问题?
SIGIR2022 | UCCR: 以用户为中心的对话推荐系统
本文介绍被CCF A类会议SIGIR2022接收的以用户为中心的对话推荐系统的论文。该论文从推荐系统的角度重新审视了现有的对话推荐工作,发现现有方法关注于当前会话的自然语言理解,而忽略了推荐任务中最核心的目标:用户。现有方法本质上当前会话的建模,而忽略了用户建模。而本文发现用户历史会话和相似用户信息也可以很好地辅助用户兴趣建模,特别是在用户当前会话信息较少(冷启动)的场景下效果更佳。
张小磊
2022/05/26
7700
SIGIR2022 | UCCR: 以用户为中心的对话推荐系统
从零开始了解推荐系统全貌
| 导语 根据实际项目经验,从零开始介绍推荐的基础知识与整体框架。希望能帮助大家在了解部分碎片化知识后,形成对推荐系统全貌的认知。 本文作者:yijiapan,腾讯WXG数据科学 一、推荐算法的理解如果说互联网的目标就是连接一切,那么推荐系统的作用就是建立更加有效率的连接,节约大量用户与内容和服务连接的时间和成本。如果把推荐系统简单拆开来看,推荐系统主要是由数据、算法、架构三个方面组成。 数据提供了信息。数据储存了信息,包括用户与内容的属性,用户的行为偏好例如对新闻的点击、玩过的英雄、购买的物品等等。这些数
腾讯大讲堂
2022/03/03
4.6K0
WSDM'23 推荐系统论文梳理
WSDM'23已公布录用结果,共收到投稿690篇,录用123篇,录用率为17.8% ,完整录用论文列表见WSDM'23 Accepted Papers。
枫桦
2022/12/17
1.6K0
推荐系统中的冷启动问题及解决方案
推荐系统是当今互联网产品的核心组成部分,广泛应用于电商、流媒体、社交网络等领域。其主要目的是根据用户的历史行为、偏好、和属性,向用户推荐其可能感兴趣的内容。然而,在实际应用中,推荐系统常常面临一个棘手的问题——冷启动问题(Cold Start Problem)。该问题指的是在没有足够的用户行为数据时,系统难以为新用户或新物品提供有效的推荐。
数字扫地僧
2024/08/09
5510
Bandit算法学习与总结(一)
MAB问题又称多臂老虎机问题,一个老虎机上有多个老虎臂,每次摇动不同的臂会得到不同的收益,那么如何才能让多次尝试后整体收益最大?这就是多臂老虎机问题。 MAB问题可以采用Bandit算法来解决,Bandit算法的思想是希望在多次摇臂后的累积遗憾最小,遗憾即为最好收益与实际收益的差值。这类方法通常包含三个方面,环境、臂和回报。在推荐系统中,不同的策略或者不同的物料池就是不同的臂,而回报就是指用户的反馈。 在推荐系统中Bandit算法通常可用于冷启动和EE问题,冷启动问题即当新用户或新商品出现时,在系统中缺乏他们的交互数据,从而对兴趣推荐造成困扰;推荐系统中的EE问题为Exploration(探索)和Exploitation(利用)问题。
秋枫学习笔记
2022/09/19
9790
推荐系统冷启动
冷启动是推荐系统的重要挑战之一。那么,什么是冷启动?如何设计一个好的冷启动方案?本文将主要从以下7个方面给大家讲清楚这些问题:
小萌哥
2020/07/21
1.6K0
推荐系统冷启动
论文快报 | 推荐系统领域最新研究进展
在线推荐需要处理快速变化的用户偏好。深度强化学习(DRL)作为一种在与推荐系统交互过程中捕捉用户动态兴趣的有效手段,正在受到人们的关注。然而,由于状态空间大(如用户物品评分矩阵和用户档案)、动作空间大(如候选物品)和奖励稀疏,训练DRL代理具有挑战性。现有的研究鼓励实施者通过经验重放(ER)从过去的经验中学习。然而他们不能很好地适应在线推荐系统的复杂环境,而且不能根据过去的经验来确定最佳策略。为了解决这些问题,作者设计了一个新的状态感知经验重放模型,该模型使用位置敏感哈希将高维数据映射到低维表示,并使用优先奖励驱动策略以更高的机会重放更有价值的经验。本文的模型可以选择最相关和最显著的经验,并推荐策略最优的代理。在三个在线仿真平台上的实验证明了该模型的可行性和优越性。
张小磊
2021/10/27
1.2K0
推荐系统技术演进趋势:从召回到排序再到重排
地址:https://zhuanlan.zhihu.com/p/100019681
DeePR
2020/01/16
2.6K0
推荐系统技术演进趋势:从召回到排序再到重排
WSDM'22「微软+美团」探索与利用EE:HCB在整个商品空间探索
EE是推荐系统中不变的话题,我们需要通过探索用户的兴趣来避免进入闭环,增加推荐系统的多样性和个性化,因此需要在探索和利用之间做权衡。
秋枫学习笔记
2022/09/19
4450
对话推荐系统的进展与五个关键挑战
推荐系统旨在从用户的交互历史识别出用户的偏好,目前已经在工业界得到广泛应用。但是传统静态推荐模型难以解决两个重要的问题。1,用户到底喜欢什么?2,为什么用户喜欢一个物品?因为静态的推荐模型缺乏用户的实时反馈和显式指导。
AI科技评论
2021/12/08
1K0
对话推荐系统的进展与五个关键挑战
盘点5类推荐系统中图学习解决冷启动问题的方法
在之前的文章长尾预测效果不好怎么办?试试这两种思路中,我曾经介绍了两种解决推荐系统中长尾、冷启动问题的方法。其中,图学习解决冷启动和长尾问题,是业内目前研究非常多的一个方向。通过构造复杂的关系图,利用邻居节点的信息帮助中心冷启动节点的学习,可以大幅提升冷启动样本的预测效果。今天对图学习解决冷启动问题这个方向进行了详细整理,整理了5种类型7篇顶会工作,帮助大家系统性理解如何利用图学习解决推荐系统冷启动问题。
圆圆的算法笔记
2022/12/19
1.1K0
盘点5类推荐系统中图学习解决冷启动问题的方法
浅谈推荐系统
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
week
2019/11/20
8460
推荐阅读
相关推荐
推荐系统中的冷启动和探索利用问题探讨
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档