前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >XRec: 大模型如何重塑推荐系统的可解释性

XRec: 大模型如何重塑推荐系统的可解释性

作者头像
张小磊
发布于 2024-06-18 08:15:48
发布于 2024-06-18 08:15:48
6820
举报

TLDR: 这篇文章给大家分享来自香港大学数据智能实验室最近推出的智能推荐大模型XRec,旨在利用大语言模型为推荐系统提供基于自然语言的可解释性。

论文:https://arxiv.org/pdf/2406.02377 代码:https://github.com/HKUDS/XRec 主页:https://sites.google.com/view/chaoh

导读

传统推荐系统虽然能给出准确的推荐结果, 但缺乏对推荐逻辑的解释, 难以让用户真正理解和信任。让推荐系统能以自然语言向用户阐述其推荐依据, 不仅能增强用户的理解, 还能促进他们与系统的互动, 从而获得更满意的体验。

与此同时,可解释性推荐系统可以增强推荐系统的智能化。自然语言模型具有深入理解用户需求和偏好的能力, 能够形成更细致入微的用户画像。基于这种丰富的用户洞见, 推荐系统不仅能做出更精准的推荐, 还可以为用户提供有价值的决策支持, 进一步提高系统的智能化水平。总的来说, 可解释性推荐系统有助于实现人机协作, 推动推荐技术的发展。

因此,基于提升用户体验和增强推荐系统智能化的动机, 受启发于大语言模型强大的自然语言能力, 港大数据智能实验室致力于开发能够让推荐系统具备可解释性语言能力的大模型。

这一方向的研究旨在突破传统推荐系统的局限性, 让推荐系统不仅能给出精准的结果, 还能用通俗易懂的语言向用户解释其推荐依据。通过整合大语言模型的语义理解能力和协同过滤的用户偏好建模, 港大数据智能实验室正在探索构建一种"可解释推荐"(XRec)大模型框架, 使推荐系统具备洞察用户需求、生成准确解释的智能化水平。

这种融合自然语言处理和推荐系统的创新尝试, 不仅能大幅提升用户体验, 增强他们对推荐结果的理解和信任, 也将为推荐技术的发展注入新的活力, 最终实现人机协作, 为用户提供更优质的智能服务。

模型方法

XRec 利用大型语言模型 (LLMs) 为推荐系统的输出提供丰富的自然语言解释。通过整合协作信号并采用轻量级推荐信号适配器,XRec 深入理解用户偏好和用户-物品交互中的复杂模式。该框架在具有挑战性的零样本场景中, 展现了其在未见用户和物品方面的出色泛化能力。

协同关系Tokenizer

为了有效地捕捉大量用户和商品之间的协作关系, 以及反映他们的交互模式, 自然语言的表达能力是不足的, 但表征(representation)提供了一种强大的替代方案。在我们的XRec系统中, 我们利用图神经网络 (GNNs) 作为协同信号的tokenizer,将复杂的用户-商品交互关系信息编码到潜在的嵌入空间中, 从而实现对复杂用户偏好的有效建模。具体而言, 我们的协作图 tokenizer 基于图神经网络的消息传递机制(message passing), 在用户-商品交互图中进行信息的传播和聚合, 促进用户和商品节点表征的学习。这样不仅能够更好地捕捉节点之间的关联, 还能够反映出复杂的交互模式。

大语言模型的输入适配器

协同信息适配器 (Collaborative Information Adapter)鉴于用户-商品交互行为所反映的协同信息, 其语义表示空间(embedding space)可能与用户和商品的文本语义存在差异, 我们的XRec模型配备了一个轻量级但有效的适配器模块。此适配器的作用是对这些不同的语义模态进行对齐, 使我们的模型能够有效地融合利用协同信号和文本语义, 从而提升整体的建模能力。

协同过滤(CF)与大语言模型(LLM)的融合在对嵌入进行新的适配之后, 我们现已做好将协同信息融入大语言模型的准备。我们引入了特殊的标记(tokens)来保留输入提示中的空间, 然后将提示转换为token嵌入后, 将已适配的嵌入注入到这些保留的位置中。

然而, 由于每个节点嵌入在输入提示中仅由一个单一的token表示, 随着输入长度的增加, 分配给每个嵌入token的注意力权重(attention weight)不可避免地会减弱, 这可能导致协同信息的损失。为了解决这种影响力的稀释问题, 我们将适配后的嵌入扩展到LLM的初始输入提示之外。具体来说, 我们将它们注入到LLM每一层的保留位置中。为了促进这一过程, 我们修改了LLM内部每一层的query、key和value投影函数如下:

我们用表示查询(query)、键(key)和值(value)的投影矩阵, 用表示适配后的嵌入。我们的方法确保大型语言模型(LLMs)不仅在输入阶段, 而且在整个网络结构中都能不断访问和整合协同信息。通过将基于图的知识注入到LLMs的所有层中, 我们不仅保持了协同上下文的强大表征, 还使得直接回到专家混合(MoE)模块的梯度流更为有效。这种创新的语言建模和图表示学习的融合, 使我们的模型能够利用LLMs提供的深层语境洞见, 同时从图神经网络(GNN)识别的结构模式中获益。

损失函数

为了提升大型语言模型(LLMs)生成语境和句法连贯解释的能力, 我们的目标是最小化预测下一个token的概率与实际下一个token之间的损失。我们采用负对数似然(Negative Log Likelihood, NLL)作为训练损失, 计算公式如下:

其中, N 为解释的数量, 为每个解释中的字符计数, 和 ŷ 分别表示实际和预测的token。为了降低训练复杂度, 我们冻结了LLMs内部的所有参数, 不包括与图神经网络(GNN)训练过程的任何交互。唯一可训练的参数是在基于专家混合(Mixture of Experts, MoE)的适配器模型中的参数。

基准解释的生成

之前的研究直接使用用户评论作为推荐系统的基准解释。然而, 这些评论往往带有主观色彩, 可能只是隐含地传达了用户的意图或情绪。为了解决这一限制, 提高基准解释的质量, 我们创新性地使用大型语言模型(Large Language Model, LLM)从原始评论中提取出明确的用户意图。

实验验证

我们在三个公开数据集(Amazon-books、Yelp和Google-reviews)上使用GPTScore、BERTScore等指标评估了XRec模型。实验结果表明, XRec在可解释性和稳定性方面均显著优于所有基准模型(Att2Seq、NRT、PETER和PEPLER)。

模型鲁棒性的探索

为了评估模型的泛化能力, 我们在不同数据稀疏性的数据集上进行了实验。根据用户在训练数据中出现的频率, 我们将测试数据划分为五个子集(tst1到tst5)。这使我们能够系统地检查模型在不同用户熟悉度范围内的有效性, 从罕见到频繁的用户。此外, 我们引入了一个零样本测试数据集, 其中仅包含训练期间未遇到的用户, 以测试模型解决冷启动问题的能力。

在零样本场景中, 由于缺乏任何先前的用户数据, 我们的模型不仅优于基线, 而且与其他子集(从tst1到tst5)的表现相当。这种能力对于新用户的推荐非常有价值, 也突显了我们方法在实际应用中的实用性, 其中用户行为和项目目录经常变化。

这些发现强调了我们的模型在传统推荐系统面临的挑战中的有效性, 例如涉及新用户或不频繁用户的情况。模型在零样本学习中的成功证明了其强大的泛化能力, 并突显了其解决冷启动问题的潜力, 即新用户或项目缺乏历史交互数据。通过在不同情境中保持高水平的可解释性和稳定性, 该模型证明了其适用于动态环境中部署, 其中用户行为和项目目录经常变化。

模型消融实验

我们进行了消融实验, 以探索模型中两个关键组件的影响:用户/项目属性和协同信息的注入。我们比较了以下四种模型变体:

  • 完整模型(Ours): 包含所有特性
  • 无属性(Ours w/o profile): 省略了用户和项目属性
  • 无协同信号注入(Ours w/o injection): 保留了对齐嵌入在提示中, 但未将其注入到LLM层
  • 无属性&协同信号注入(Ours w/o profile & injection): 缺少属性和基于协同信号嵌入的注入

为了严格评估可解释性和稳定性, 我们使用GPTScore和BERTScore在Amazon-books和Google-reviews数据集上评估了这些变体, 包括它们的标准差。这揭示了每个元素在推动模型性能和能力方面的关键作用。结果显示, 我们的完整模型(Ours)在可解释性和稳定性方面优于其他变体, 突出了每个元素的重要贡献。

结语

本文提出了一个新颖的XRec框架, 它无缝集成了基于图的协同过滤范式和大语言模型(LLMs)的能力, 以生成对推荐输出的全面且富有洞察力的解释。通过利用用户-商品交互图中编码的固有协同关系, XRec能够有效捕获构成用户偏好和项目关联的高阶依赖性。XRec引入了一个专门的协同信息适配器, 作为建立协同信号(collaborative signal)与LLM内丰富的文本语义空间(embedding space)之间强连接的关键桥梁。

广泛的实验结果强调了XRec框架的显著优势。它不仅增强了推荐过程的可解释性, 还确保了在具有挑战性的零样本场景中的鲁棒性。XRec框架在这些场景中展示了强大的跨未见用户和项目的泛化能力。


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与推荐算法 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
代理 IP:网络世界的多面助手
在互联网这个庞大的数字王国中,IP 地址就如同我们在现实世界中的家庭住址,是每台联网设备的身份标识。但你是否听说过代理 IP 呢?它就像是一位神通广大的 “中间人”,在网络活动中发挥着多样且重要的作用。接下来,让我们一同深入了解代理 IP 这一神奇的网络工具。​
爱分享的羊
2025/05/14
730
住宅代理IP市场需求不断增长,未来有哪些发展前景?
随着代理市场规模的不断扩大,未来对住宅代理IP的需求将继续增长。这一趋势不仅反映了互联网发展的趋势,也说明了人们对于网络安全和隐私保护的重视。住宅代理IP作为一种网络代理服务,可以有效地保护用户的隐私和安全,同时也可以帮助企业实现网络营销和数据采集等目标。在以后的发展中,住宅代理IP的市场需求将会继续保持增长态势,未来的住宅代理IP市场将会呈现多重趋势:
用户10746662
2023/09/19
2940
住宅代理IP市场需求不断增长,未来有哪些发展前景?
PD接收协议芯片:技术革新与市场展望
在数字化浪潮的席卷下,数字通信已成为现代社会的核心动脉,连接着世界的每一个角落。然而,随着通信技术的迅猛发展,数字通信的可靠性和安全性问题也日益凸显,特别是在协议芯片的接收环节。PD接收协议芯片,作为一种引领行业变革的新型通信协议芯片,凭借其独特的技术优势和应用前景,正逐渐走进人们的视野。本文将从产品功能、应用领域以及市场前景三个方面,深入剖析PD接收协议芯片的技术特点、发展趋势及市场潜力,并针对其存在的问题提出相应的解决方案。
legendary_163
2024/05/29
1930
未来的发展趋势:网络安全与人工智能
未来,随着人工智能技术的不断发展,网络技术也将会得到迅速的发展。其中,网络安全将会是网络技术的重要发展方向之一。随着网络安全问题的不断升级,各种安全技术将会得到更加广泛的应用,以保障网络通信的安全。同时,人工智能技术的应用将会更加普及,例如在数据挖掘、智能化网络安全监测等领域,人工智能将会发挥越来越重要的作用。未来网络技术将会更加智能化、自动化,同时也会更加注重数据隐私保护和安全性。
用户10616523
2023/06/21
2100
2024年,计算机相关专业的就业前景和发展趋势分析
随着2024年高考落幕,数百万高三学生又将面临人生中的重要抉择:选择大学专业。在这个关键节点,计算机相关专业是否仍是“万金油”的选择?在过去很长一段时间里,计算机科学与技术、人工智能、网络安全、软件工程等专业一直以来是炙手可热的存在,吸引了大批学生前往。然而,随着行业竞争加剧和市场饱和度提高,该类专业是否仍具有长远的发展潜力和就业前景呢?快来谈谈你的看法吧!假如你是今年的高考生,站在分岔路口上的你又该如何判断自己是否适合这类专业呢?而作为过来人和从业者,你认为计算机行业的未来发展态势会是怎样的呢?不妨从不同的身份角度来聊一聊自己的观点吧!
默 语
2024/11/22
8320
云计算的未来发展趋势与优势,你是否了解?
随着数字化转型的加速,越来越多的企业开始选择云计算作为信息技术应用的基础设施。那么,云计算究竟有哪些优势?未来发展趋势又是怎样的呢?今天我给大家来介绍一下。
网络豆
2023/10/15
8320
云计算的未来发展趋势与优势,你是否了解?
区块链技术发展趋势与银行业探索实践
在数字化转型的大背景下,全球主要国家都在加快布局区块链技术,抢占新一轮创新变革的高地。
用户7358413
2021/09/01
9080
区块链技术在代理IP领域的应用与前景展望
近年来,区块链技术在各个领域都展现出巨大的潜力,代理IP领域也不例外。本文将探讨如何利用区块链技术改进代理IP系统的可信度、可追溯性和隐私保护,并展望这一技术在未来的发展前景。
用户10616523
2023/07/10
2930
区块链技术在代理IP领域的应用与前景展望
工业物联网时代下 SCADA 系统的七大发展新趋势
在工业物联网的时代背景下,SCADA系统迎来了全新且意义深远的发展趋势,这些趋势将深刻影响工业生产的各个环节,助力企业实现更高效、智能、安全的运营。
用户10637273
2025/04/03
1250
咕咕送书第三期 | 大数据时代如何保护我们的网络安全?
🎬 鸽芷咕:个人主页 🔥 个人专栏:《粉丝福利》 《C语言进阶篇》
鸽芷咕
2023/12/25
1460
咕咕送书第三期 | 大数据时代如何保护我们的网络安全?
使用Python隧道代理实现跨地域数据采集与分析
在当今信息蓬勃发展的时代,跨地域数据采集和分析对于企业以及个人的决策和发展至关重要。本文将介绍如何利用Python隧道代理技术,实现跨地域数据采集与分析,让您在数据获取和分析方面拥有全新的可能性。
华科云商小彭
2023/09/06
2540
使用Python隧道代理实现跨地域数据采集与分析
IT行业的现状与未来发展趋势
随着技术的不断进步,IT行业已成为推动全球经济和社会发展的关键力量。从云计算、大数据、人工智能到物联网、5G通信和区块链,这些技术正在重塑我们的生活和工作方式。本文将从多个角度探讨IT行业的现状及未来发展趋势,并分享我对这一领域的见解。
洛秋_
2024/08/04
1.7K0
浅析2025年后端编程发展趋势
随着技术的不断发展,2025年的后端编程可能会有多种热门技术。云原生技术将持续火热,云原生应用强调将应用程序完全构建和部署在云环境中,充分利用云计算的优势。容器化技术作为云原生的重要组成部分,像Docker这种容器化技术可以将应用程序及其依赖项打包成一个独立的运行单元,实现了跨平台、可移植的部署方式,在2025年也依然会是后端开发的重要技术。
码农编程进阶笔记
2024/11/29
1.2K0
浅析2025年后端编程发展趋势
【云端风云:云计算全局解密】一篇文章读懂云计算技术及其未来发展趋势
在当今数字化浪潮中,云计算如一颗闪烁的科技明珠,为企业和个人带来了前所未有的灵活性、效率和创新力。本文将带领读者深入探索云计算的核心概念、关键服务模型以及未来发展趋势。云计算不仅是数字化时代的基石,更是推动创新和变革的引擎。站在云端风云之巅,我们将解析云计算的奥秘,揭晓数字化未来的蓬勃蔓延。通过这场科技奇迹的探索,我们将共同领略云计算为全球带来的变革,见证科技与未来的奇妙融合。
奥耶可乐冰
2023/11/24
1.5K0
【云端风云:云计算全局解密】一篇文章读懂云计算技术及其未来发展趋势
共筑透明、信任、安全的“数据·AI”未来——GDTC隐私科技与数据跨境流通论坛圆满落幕
2024年10月29日至30日,首届全球数据技术大会(Global Data Technology Conference, GDTC)在北京隆重召开。大会由下一代互联网国家工程中心主办,汇聚了来自世界各地的数据技术专家、行业领袖以及产业代表,共同探讨数据技术的未来发展趋势。“隐私科技与数据跨境流通论坛”作为此次大会的首个专题论坛,吸引了众多来自产业界和学术界的顶尖人士,包括腾讯、抖音、华为、滴滴、万事达卡等企业的资深从业者,以及东南大学、香港科技大学(广州)等高校的专家学者。他们深入探讨了如何通过技术和工程化手段,在网络、数据、AI模型、产品服务和应用等方面实现隐私保护,并解决数据流通中的透明、信任、安全问题。
CFIEC
2024/11/01
1780
共筑透明、信任、安全的“数据·AI”未来——GDTC隐私科技与数据跨境流通论坛圆满落幕
边缘计算网关|物联网智能网关
工厂里的每一台设备都在产生数据。从设备数据的视点,能够从海量数据的背面发掘和剖析设备非预期停机的原因、进步成品率的途径等,找出更好的设备维护方法,从而进步工厂的全体出产功率。边缘计算网关是处理大数据而生的,同时把数据结果传入云端;这是大数据在工业领域的价值地点。然后设备数据的收集、传输和监控成为关键步骤。在市场需求更新和技能晋级的过程中,边缘计算网关(物联网智能网关www.wtblnet.com)应运而生。为了更好地认识其价值和机会,咱们应该从设备和机器数据的收集、传输和监控的开展过程下手。
用户6789871
2019/11/28
5.1K0
边缘计算网关|物联网智能网关
小程序未来趋势预测:技术革新与市场前景
在数字化转型加速的时代,小程序作为一种轻量级、无需下载安装的应用形式,凭借其快速开发、易于使用的特点,迅速崛起并成为企业和开发者拓展业务的重要工具。随着移动互联网的进一步普及和用户对便捷应用体验的需求增长,小程序的市场规模正迎来前所未有的发展机遇。本文将从技术革新与市场前景两个维度,深入探讨小程序的未来趋势。
小白的大数据之旅
2025/01/08
2740
分布式传感器网络的分类
一个分布式传感器网络(下简称分布式传感器网络)由一系列用互联网络联接起来的传感器组成。这些传感器可以嵌入到一个集成电路装置中,能够采集信号,处理信号,相互通信和执行简单的计算任务。传感器布置在不同的环境中,各种传感器采集到的数据必须进行综合,以得到新的信息。通常情况下,这种合成必须在一定的时间限制内可靠地完成,以保证信号的客观真实性。在某些特定的应用中,比如在自动化系统中,这些任务必须周期性地执行以满足性能限制的要求。
利又德智能感知
2025/04/03
1150
无头 CMS 深度剖析:架构、优势与未来发展趋势
在数字内容如潮水般涌现的当下,内容管理系统(CMS)成为了企业驾驭内容洪流的关键工具。而在众多 CMS 类型中,无头 CMS 正以其独特魅力,逐渐崭露头角,成为行业焦点。它为何能吸引众多企业的目光?其架构有何独特之处?未来又将如何发展?让我们一同深入探寻无头 CMS 的奥秘。
KATSU
2025/05/15
1390
无头 CMS 深度剖析:架构、优势与未来发展趋势
代理IP、Socks5代理和SK5代理的前沿技术与未来发展趋势
用户10616523
2023/07/14
2660
代理IP、Socks5代理和SK5代理的前沿技术与未来发展趋势
推荐阅读
相关推荐
代理 IP:网络世界的多面助手
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档