Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >SIGIR2023 | 当Transformer遇上图神经网络, 推荐系统新范式GFormer

SIGIR2023 | 当Transformer遇上图神经网络, 推荐系统新范式GFormer

作者头像
张小磊
发布于 2024-06-07 06:59:36
发布于 2024-06-07 06:59:36
4670
举报

TLDR: 本文针对现有自监督和图神经网络结合的模型局限性,提出了一种能够根据下游任务进行自适应监督信号增强的模型GFormer,同时引入了任务相关性等模块的设计,提升了模型的表达能力和适应性表现。

论文:https://arxiv.org/abs/2306.02330 代码:https://github.com/HKUDS/GFormer 主页:https://sites.google.com/view/chaoh

01、研究背景

图神经网络和自监督方法结合的推荐方法研究如火如荼,一系列基于互信息最大化的对比学习范式的自监督模型被提出,并且取得了不错的效果,如SGL、SimGCL、HCCF等。然而,一个很基础的问题却一直没有得到很好的解答:究竟是什么样的监督信号才应该被保留和增强以最大化模型的效果表现呢?

另外,基于人工设计的增强方案往往难以适应各个场景的推荐任务,有没有一种方案能够自适应的根据下游任务来提取最合适的自监督信号以适应性增强模型的表达能力呢?

为了解决上述问题,我们提出了Graph Transformer for Recommendation (GFormer) 模型,能够自适应的根据不同的场景信息以提取出最重要的监督信号来进行协同过滤信号的增强。具体来说,我们受到Rationale-aware方法和Transformer的启发,通过RA子图发掘方法和self-attention的结合来捕获最重要的RA子图结构,并据此进行下游任务自适应监督信号的效果增强。

总体来说,本文主要做了如下贡献:

  1. 重新探索了自监督推荐中的SSL增强范式中的数据增强的原理。借此,我们不仅实现了SSL中的自适应数据增强,而且提供了基于自监督信号增强的可解释性原理分析。
  2. 我们提出了一种通过graph transformer结构来发掘协同关系中可解释性RA子图的发掘方法并同时引入自适应模块来缓解数据偏移带来的负面影响。然后通过图自动编码器来重构重要的用户物品的交互特征。
  3. 在多个公开数据集上验证了我们的模型相比于现有GNN和自监督方法的优势,如更好的模型表现、噪声抵抗能力等。

02、模型介绍

本文所介绍的GFormer模型,其主要模块包含全局拓扑信息注入层、协同信号RA发掘层以及自监督信号增强模块。GFormer模型的框架图如下所示:

2.1 全局拓扑信息注入层

全局关系信息与GNN的结合的在很多场景下都能发挥不错的效果,受到位置感知GNN方法的启发,我们通过注入高阶信息的依赖来提升模型协同信号的发掘能力。

具体来说,我们首先选出一部分锚点,然后为了捕获全局拓扑信息,我们分别计算图节点相对于锚集的相对位置信息,结合节点和锚点的表征信息来生成全局上下文信息。如此,我们的RA子图发掘模块就可以捕获全局关系并识别出重要的用户商品交互信息以进行SSL数据增强。

2.2 适应性RA子图发掘模块

为了筛选出具有场景适应性的重要交互信息,我们提出了一种自适应的RA子图发掘方法,并以此为基础进行后续选择性的SSL的监督信号增强。这种设计可以使得我们的GFormer模型免收用户噪声行为信息带来的负面影响从而提升模型的表达能力。

具体来说,我们将包含了全局上下文和局部拓扑信息的用户商品表征信息注入到GT模块并通过自适应任务模块的引导来产生场景适应性的用户商品交互评分,并以此来筛选出包含重要交互信息特征的RA拓扑结构子图。同时,为了减少噪声带来的负面影响,我们增加了补图独立性模块的设计,以更好的增加模型的鲁棒性。

2.3 自监督信号增强模块

传统的SSL范式的自监督模型监督信号的增强方案是通过人工设计对比视图,并通过互信息最大化的方法来引入额外的自监督信号,辅助主推荐任务的学习。然而,人工设计的视图缺乏场景适应性,且会引入多余的人工噪声。为了解决这个问题,我们设计了基于MAE框架的监督信号增强方法,跳出了传统SSL增强范式的桎梏。通过适应性重构重要交互信息的方式,较少了无关噪声影响的同时,取得了更好的模型效果。

03、实验结果

我们在多个数据集上进行了对比实验,包括Yelp、Ifashion、LastFm等公开数据集,总体实验效果如下图所示。我们的模型相比于其他自监督、图神经网络的方法都有比较显著的效果提升,同时在噪声的抵抗能力等的测试表现上也有更好的效果。

此外,我们也做了一些关键的示例研究,我们在Yelp数据集上通过反向映射用户id和商品id的方式,查找源数据集中用户对于对应商品的评分、评级等信息。发现我们模型的RA子图的评分和源数据集中用户商品的评价信息具有相当程度的一致性。示例结果展示如下:

图中展示了四个用户对于其交互商品的评分和评论信息,可以看到用户的评分和评价和我们模型学习到的评分具有一定程度的一致性。用户评价较满意的情况下,我们的模型相应交互的评分也较高。而对于编码为3136的用户,尽管他对于商品929比较满意,模型评分却相对较低0.44,其原因是,该用户倾向于对大多数物品评价一个较高的星级。我们统计了他对于所有的交互商品的评分,发现评分是4星和5星较多,占比36/47。这验证了我们模型评分的合理性。

04、结论

我们针对现有自监督和图神经网络结合的模型局限性,提出了一种能够根据下游任务进行自适应监督信号增强的模型GFormer,同时引入了任务相关性等模块的设计,提升了模型的表达能力和适应性表现。

本文探索了自监督数据增强的一个基本问题,通过保留重要交互特征的方式,进行基于MAE框架的适应性增强,达到了SSL增强效果的同时,具有更好的抗噪声能力。在多个数据集的测试结果和示例研究证明了我们模型合理性、有效性和可解释性。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与推荐算法 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
SIGIR2023 | 基于MAE的序列推荐新范式
TLDR: 本文提出一种名为MAERec的图掩码自编码器用于序列推荐任务。其核心思想是一种新颖的自适应转移路径掩码策略,这种掩码策略能够自适应地、动态地提取用户序列形成的全局转移信息用于数据增强,以进行高效的自监督学习,以此缓解序列推荐场景中的数据稀缺和噪声干扰问题,并避免了大多数对比学习方法中出现的问题。
张小磊
2023/08/22
4370
SIGIR2023 | 基于MAE的序列推荐新范式
SIGIR2023 | 推荐系统中的解耦对比学习
TLDR: 我们将意图解耦的思想与自动化的对比学习相结合,通过学习包含全局信号的解耦意图特征和自适应的图掩码增强模块,来提供有效的自监督信号,以提高推荐算法的性能。
张小磊
2023/08/22
1.1K0
SIGIR2023 | 推荐系统中的解耦对比学习
WWW2023 | AutoCF: 面向推荐场景的自动自监督学习
TLDR: 在生成式自监督学习方法成功的启发下,本文提出了一种自动化的自监督数据增强方法,结合掩码自编码器方法,用于增强基于图神经网络的协同过滤方法。
张小磊
2023/08/22
3440
WWW2023 | AutoCF: 面向推荐场景的自动自监督学习
面向推荐场景的自监督超图Transformer
TLDR: 本文针对推荐数据中的噪声和倾斜分布问题,提出了一种基于超图Transformer的全局关系学习方法。该方法采用了自适应的超图关系学习,以得到更好的节点间关系结构,并采用全局信息传播模式,以便从交互稠密的用户、商品向交互数据稀疏的节点传递信息,并缓解交互数据在不同用户、商品节点间倾斜分布的问题。
张小磊
2023/08/22
5030
面向推荐场景的自监督超图Transformer
SIGIR'22 推荐系统论文之对比学习篇
SIGIR 2022已公布录用论文,投稿长文794篇/短文667篇,录用长文161篇/短文165篇,录用率长文20%/短文24.7%,完整录用论文列表见https://sigir.org/sigir2022/program/accepted/。
枫桦
2022/08/02
1.9K0
SIGIR'22 推荐系统论文之对比学习篇
ICLR'23 UnderReview | LightGCL: 简单而有效的图对比学习推荐系统
上周末梳理了NeurlPS'22中推荐系统相关论文,详见NeurlPS'22 推荐系统论文梳理。本想精读其中某篇,但是并没有公开。最近知乎刷到很多ICLR'23的总结文章,我把他们汇总在ICLR'23 论文整理合辑一文中(https://zhuanlan.zhihu.com/p/576413129),含扩散模型、图网络、推荐系统、强化学习、知识蒸馏、NLP等多个方向。
枫桦
2022/12/17
1.2K0
ICLR'23 UnderReview | LightGCL: 简单而有效的图对比学习推荐系统
KDD2023 | 面向推荐系统的自适应图对比学习
TLDR: 本文提出了一种新的用于推荐的自适应图对比学习范式,通过两种不同的自适应对比视图生成器来实施数据增强,以此提升协同过滤的效果。作者分别使用图生成模型和图去噪模型作为可训练的对比视图生成器,以此引入额外的自监督信号,缓解推荐数据中的稀疏和噪声问题。与此同时,自适应的的对比视图还解决了此前基于传统数据增强方法导致的对比学习模型坍塌问题。
张小磊
2023/10/25
8830
KDD2023 | 面向推荐系统的自适应图对比学习
推荐系统中不得不学的对比学习(Contrastive Learning)方法
今天我们来聊一聊推荐系统中不得不学的Contrastive Learning方法,近年来Contrastive Learning在CV和NLP领域的应用越来越广泛,在推荐系统中当然也不例外。我想大家将对比学习与推荐系统结合主要有以下四个原因:
对白
2022/04/01
1.4K0
推荐系统中不得不学的对比学习(Contrastive Learning)方法
ICML'21 | 隐私保护下的图神经网络推荐系统
现有的基于 GNN 的推荐方法依赖于用户-物品图的集中存储和集中的模型学习,然而用户数据是隐私敏感的,数据的集中存储存在隐私泄露的风险。本文提出了一个基于GNN 隐私保护的联邦学习框架,在保护隐私的前提下从离散的的用户数据中训练 GNN 模型,并利用高阶的用户物品交互信息完成高效的推荐。
Houye
2021/11/09
1.5K0
ICML'21 | 隐私保护下的图神经网络推荐系统
最新综述 | SSL4Rec: 全面探索自监督学习时代的推荐算法 (含开源代码和资料)
TLDR: 本文全面综述了自监督学习(SSL)在推荐系统中的应用,深入分析了逾170篇论文。提出了一个涵盖九大推荐场景的自监督分类体系,详细探讨了对比学习、生成学习和对抗学习三种SSL范式,并在文中讨论了未来研究方向。
张小磊
2024/05/11
4630
最新综述 | SSL4Rec: 全面探索自监督学习时代的推荐算法 (含开源代码和资料)
SIGIR2023 | 多行为自监督推荐系统
TLDR:本文针对传统多行为推荐系统存在的数据稀疏(主推荐任务)和噪声(辅助任务)等挑战,提出了一种多行为自监督推荐算法MBSSL。另外,针对多行为推荐系统存在的主任务与辅助任务优化不平衡问题,提出了一种自适应的多任务优化策略。实验验证了所提出机制的有效性。
张小磊
2023/08/22
6450
SIGIR2023 | 多行为自监督推荐系统
WWW2023 | 简单有效的无图推荐系统
TLDR: 本文提出了SimRec模型,一种无图的协同过滤推荐模型,通过知识蒸馏方法将基于GNN的CF模型中的知识提取到简单的MLP学生模型中,同时采用双层对齐方法和基于对比学习的正则化方法来提高蒸馏过程的准确性和效率,并削弱GNN模型受到噪声和过平滑的影响。
张小磊
2023/08/22
2710
WWW2023 | 简单有效的无图推荐系统
WWW'22 推荐系统论文之序列推荐篇
WWW 2022已公布录用论文,接收323篇/投稿1822篇,录用率为17.7%,完整录用论文列表见https://www2022.thewebconf.org/accepted-papers/
枫桦
2022/08/02
1.5K0
港大开源推荐系统新范式RLMRec!大模型加持,准确提炼用户/商品文本画像
推荐系统在深度学习和图神经网络的影响下已经取得了重大进步,尤其擅长于捕捉复杂的用户-物品关系。
新智元
2023/11/19
8700
港大开源推荐系统新范式RLMRec!大模型加持,准确提炼用户/商品文本画像
SIGIR'22 推荐系统论文之图网络篇
SIGIR 2022已公布录用论文,投稿长文794篇/短文667篇,录用长文161篇/短文165篇,录用率长文20%/短文24.7%,完整录用论文列表见https://sigir.org/sigir2022/program/accepted/。
枫桦
2022/08/02
1.6K0
SIGIR'22 推荐系统论文之图网络篇
SIGIR2024 | GraphGPT: 大语言模型引领图学习新范式
TLDR: 现有的许多图神经网络方法存在一个共同的局限性,即对高质量监督信号的强烈依赖,导致在处理稀疏和噪声数据时泛化性能较差。为了提升图神经网络的泛化能力,自监督学习被认为是具有潜力的研究方向。然而,这种对标注数据的依赖,可能会限制它们在缺乏高质量标注的实际场景中的泛化性能。针对上述挑战,本研究提出了一种基于大型语言模型的全新图学习方法——GraphGPT。其旨在在零样本学习场景下提升图模型的泛化能力,并在多个下游数据集和任务上展现了出色的性能。
张小磊
2024/06/18
6590
SIGIR2024 | GraphGPT: 大语言模型引领图学习新范式
因果推理相关的图神经网络研究
本文介绍两篇因果推理相关的图神经网络研究工作。 一、OOD推荐系统下的因果表征学习 本文介绍了什么是推荐系统中的Out-of-Distribution(OOD)问题,并从因果的角度提出了一种解决OOD问题的表示学习方式。 文章链接:https://dl.acm.org/doi/pdf/10.1145/3485447.3512251 1 简介 现代推荐系统的用户表征都是从其历史交互中学习出来的,这就存在着用户表征变化带来的问题,历史交互会将过时的信息注入到与最新的用户特征相冲突的表示中,从而导致不恰当的推荐
数据派THU
2023/03/29
5841
因果推理相关的图神经网络研究
YYDS!对比学习还能这么用?
自监督学习在CV和NLP已经用的很多了,那很自然也会被迅速引进并占坑到推荐系统领域咯。而发掘推荐数据上的自监督信号,其实也是十分有利于推荐系统的,主要有以下优势:
NewBeeNLP
2022/06/06
7730
YYDS!对比学习还能这么用?
KDD'22 | 自监督超图Transformer构建推荐系统
现有基于 GNN 的推荐系统的思想是递归地执行沿用户-商品交互边传递消息,从而得到相应的embedding。尽管它们很有效,但大多数当前的推荐模型都依赖于充足且高质量的训练数据,因此学习的表征可以很好地捕捉用户偏好。许多实际推荐场景中的用户行为数据通常是嘈杂的并且呈现出偏态分布,这可能导致基于 GNN 的模型中的表征性能欠佳。本文提出了 SHT,自监督超图Transformer框架 (SHT),它通过以显式方式探索全局协作关系来增强用户表征。具体来说,利用图协同过滤范式使用超图Transformer来维持用户和商品之间的全局协作效果。利用提炼的全局上下文,提出了一种跨视图生成自监督学习组件,用于在用户-商品交互图上进行数据增强,以增强推荐系统的鲁棒性。
秋枫学习笔记
2022/09/19
1.2K0
2W字长文 | 漫谈工业界图神经网络推荐系统
图神经网络是近年来很火的一个研究方向,在生物化学,推荐系统,自然语言处理等领域都得到了广泛应用。其中图神经网络在推荐系统的应用方面,已有几篇综述[1][2][3]做过详细的归纳总结。但是让人感到美中不足的是,综述中总结的多是学术型工作,偏向于GNN模型上的微调,部分工作其实就是将上游的SGC[4],GrapSage[5],JKNet[6]等模型在几个祖传玩具数据集上刷一下结果讲一个故事,很少关心模型的扩展性,也很少关心图的构建,特征处理,线上打分等不可或缺的环节。
Houye
2021/11/17
1.5K0
2W字长文 | 漫谈工业界图神经网络推荐系统
推荐阅读
相关推荐
SIGIR2023 | 基于MAE的序列推荐新范式
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档