首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >推荐系统中的常用算法——基于Session的推荐

推荐系统中的常用算法——基于Session的推荐

作者头像
felixzhao
发布于 2022-03-04 09:49:40
发布于 2022-03-04 09:49:40
1.6K0
举报
文章被收录于专栏:null的专栏null的专栏

1. 概述

《Session-based recommendations with recurrent neural networks》首次提出将RNN方法应用于Session-based Recommendation。文章中提到当前主流的基于因子分解的模型或者基于邻域的模型很难对整个Session建模,得益于序列化建模算法的发展,使得基于Session的推荐模型成为可能,针对具体的任务,文章中设计了模型的训练以及ranking loss。

2. 算法原理

在文章中采用的GRU(Gated Recurrent Unit)序列化建模算法,这是一种改进的RNN算法,能够较好的解决RNN中的长距离以来问题。在Session-based Recommendation中,将用户登录后产生点击作为RNN的初始状态,基于这个初始状态查询后续是否会点击,其流程大致如下所示:

其中,x0 作为初始状态,h 表示RNN的隐藏状态^y 表示输出,由初始状态,可以得到后续的输出。

2.1. GRU

GRU全称为Gated Recurrent Unit,是RNN模型的增强版,能够有效解决RNN模型中的长距离以来问题。在GRU中,输入为前一时刻隐藏层ht1 和当前输入xt ,输出为当前时刻隐藏层信息ht 。GRU中包含两个门,即reset门rt 和update门zt ,其中rt 用来计算候选隐藏层~h ,控制的是保留多少前一时刻隐藏层ht1 的信息。zt 用来控制加入多少候选隐藏层~h 的信息,从而得到输出ht 。GRU的结构如下图所示:

2.2. 模型结构

通过堆叠多层的GRU,可以实现对用户点击序列的建模,Session-based Recommendation的模型结构如下图所示:

在模型的损失函数方面,文章中采用了pairwise ranking losses,其中pointwise在训练过程中并不稳定。

三种ranking的方式:

  • Pointwise ranking:针对的是单个样本预测得分,典型的如CTR;
  • Pairwise ranking:对样本对的预测,使得正样本正样本的得分要比负样本的小;
  • Listwise ranking:预测的是所有样本的得分,以得到最终的排序;

文中使用了两种基于Pairwise ranking的损失函数:Bayesian Personalized Ranking(BPR)和TOP1,其中BPR是一种矩阵分解的方法,其公式为:

Ls=1NsNsj=1log(σ(^rs,i^rs,j))

其中,Ns 是样本量,^rs,k 是item k 的分数,i 表示session中的正样本,j 表示负样本。TOP1是一种正则估计的方法,其公式为:

Ls=1NsNsj=1σ(^rs,j^rs,i)+σ(^r2s,j)

2.3. 模型训练

在训练的过程中,文中提出了两种策略来提高训练的效率,分别为mini-batch和负样本采样。其中mini-batch的过程如下图所示:

简单来讲就是将多个Session可以进行合并,但是在训练的过程中,在同一个Sequence中遇到下一个Session时,要对GRU重新初始化。

如上,从Session中得到的是正样本,但是训练的过程中不能只存在正样本,此时需要负样本,对于上图中Output中的每一位,通过在样本库中随机采样,生成负样本。

3. 实验的结论

由于我没自己做过实验,在此总结下原作者的几条结论,有待后续在工作中具体验证:

  • 一层的GRU单元效果最好。作者没有给出确定的解释;
  • 直接使用one-hot编码,不使用embedding;
  • 使用上一时刻预测当前时刻,这并不会比使用整个session带来更多提升;
  • 在GRU后面使用前馈层并不会带来提升;
  • 增大GRU的size会提升效果;
  • 在输出层使用tanh激活函数。

参考文献

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
专栏 | 9 篇顶会论文解读推荐中的序列化建模:Session-based Neural Recommendation
作者丨白婷 学校丨中国人民大学博士生 研究方向丨深度学习、推荐系统,大数据管理与分析方法 本文经授权转载自知乎专栏「RUC AI Box」。 前言 本文对 Recurrent Neural Network 在推荐领域的序列数据建模进行梳理,整理推荐领域和深度学习领域顶会 RecSys、ICLR 等中的 9 篇论文进行整理。图片和文字来源于原文,帮助读者理解,有争议的请联系我。 Session-based neural recommendation 首先介绍下 session-based 的概念:sessi
机器之心
2018/05/10
3.1K0
【技术分享】推荐系统之序列化建模
近些年推荐系统领域已经有不少序列化建模的实践,本文将选择部分论文进行简单的分析和整理,旨在产生指引的作用。
腾讯云TI平台
2020/04/10
1.8K0
基于RNN的序列化推荐系统总结
2. Parallel Recurrent Neural Network Architectures for Feature-rich Session-based Recommendations
Houye
2021/04/22
4200
基于RNN的序列化推荐系统总结
推荐系统遇上深度学习(四十)-使用RNN做基于会话的推荐
好啦,是时候继续我们推荐系统的学习了,从本篇开始,我们来一起了解一下Session-Based Recommendation。今天,我们介绍的文章题目为《SESSION-BASED RECOMMENDATIONS WITH RECURRENT NEURAL NETWORKS》,通过循环神经网络来进行会话推荐。论文下载地址为:http://arxiv.org/abs/1511.06939。
石晓文
2019/05/13
6.7K0
推荐系统遇上深度学习(四十)-使用RNN做基于会话的推荐
使用深度学习构建先进推荐系统:近期33篇重要研究概述
选自arXiv 作者:Ayush Singhal、Pradeep Sinha、Rakesh Pant 机器之心编译 除了计算机视觉和自然语言处理,深度学习近年来在推荐系统上也取得了引人关注的结果。事实上,Spotify、Netflix、Facebook、谷歌等公司早已对深度学习推荐系统有过深入研究,并在实际应用中取得了很好的效果。来自 Contata Solutions 的研究人员发表在 IJCA 上的概述论文对这些研究进行了梳理。 论文:Use of Deep Learning in Modern Rec
机器之心
2018/05/11
1K0
深度学习在推荐系统中的应用
2016年DeepMind开发的AlphaGo在围棋对决中战胜了韩国九段选手李世石,一时成为轰动全球的重大新闻,被全球多家媒体大肆报道。AlphaGo之所以取得这么大的成功,这其中最重要的技术之一是深度学习技术。经过这几年的发展,深度学习技术已经在图像分类、语音识别、自然语言处理等领域取得突破性进展,甚至在某些方面(如图像分类等)超越了人类专家的水平。深度学习技术驱动了第三次人工智能浪潮的到来。
kbsc13
2019/10/21
1.4K0
深度学习在推荐系统中的应用
递归的艺术 - 深度递归网络在序列式推荐的应用
在内容爆炸性增长的今天,个性化推荐发挥着越来越重要的作用,如何在海量的数据中帮助用户找到感兴趣的物品,成为大数据领域极具挑战性的一项工作;另一方面,深度学习已经被证明在图像处理,计算机视觉,自然语言处理等领域都取得了不俗的效果,但在个性化推荐领域,工程应用仍然相对空白。 本文是深度学习在个性化推荐实践应用的第二篇,在第一篇中,我详述了如何利用历史沉淀数据挖掘用户的隐藏特征,本文在上一篇的基础上进行延伸,详细分析如何利用LSTM,即长短时记忆网络来进行序列式的推荐。 1从RBM,RNN到
腾讯大数据
2018/01/29
1K0
递归的艺术 - 深度递归网络在序列式推荐的应用
用户行为序列推荐模型
导读:今天我们谈谈用户行为序列上的推荐模型。首先我们对序列推荐问题做一个定义和描述,然后主要讲述可以用在序列推荐任务中的 NN 模型,最后给出一点个人看法以及文中相关的参考文献供参阅。
石晓文
2019/12/20
5.2K0
用户行为序列推荐模型
深度网络CTR建模
CTR预估是现如今的搜索、推荐以及广告中必不可少的一部分,CTR预估的目标是预估用户点击给定item的概率。经过这么多年的发展,CTR预估算法得到了较大的改进,从开始的线性模型LR,发展到带有特征交叉的FM算法,随着深度网络的发展,CTR预估也逐渐发展到如今的基于深度模型的CTR预估,期间出现了较大一批成功在业界得到广泛应用的算法模型,如Wide & Deep,DeepFM,DIN,DIEN等等。
felixzhao
2022/12/30
6840
当推荐系统邂逅深度学习
推荐系统之于用户的角色,有时更像是无微不至的男朋友,你口渴时递给你符合口味的饮料,你饥饿时还你以常吃的披萨,你无聊时帮你推荐有趣的音乐亦或带你欣赏感兴趣的电影。
张小磊
2019/08/16
8180
当推荐系统邂逅深度学习
一文梳理序列化推荐算法模型进展
| 作者:朱勇椿 | 单位:中国科学院大学 | 研究方向:跨域推荐、多任务学习
张小磊
2021/08/06
7870
WWW'22「华为」CPR Loss:交叉成对排序损失对推荐系统纠偏
通常推荐系统在观察到的交互数据上优化模型,这受之前的曝光机制的影响,会存在许多偏差,如流行度偏差。本文提出了一种新的学习范式,称为交叉成对排名(CPR),在不知道曝光机制的情况下实现无偏见的推荐。对多个观察到的交互进行一次采样,并将它们的预测的组合来构成损失。
秋枫学习笔记
2022/09/19
4440
ICDM论文:探索跨会话信息感知的推荐模型
会话推荐是推荐领域的一个子分支, 美团平台增长技术部也在该领域不断地进行探索。不久前,该部门提出的跨会话信息感知的时间卷积神经网络模型CA-TCN被国际会议ICDM NeuRec Workshop 2020接收。本文会对论文中的CA-TCN模型进行介绍,希望能对从事相关工作的同学有所帮助或者启发。
美团技术团队
2020/12/14
6580
ICDM论文:探索跨会话信息感知的推荐模型
覆盖四种场景、包含正负向反馈,腾讯、西湖大学等发布推荐系统公开数据集Tenrec
近些年来,通过各种内容平台浏览视频或者是阅读文章的用户越来越多,而现有的推荐算法有时难以很好地建模用户的偏好,因此需要更准确的推荐系统模型。但已知的推荐系统(RS)的基准数据集要么是小规模的,要么是用户反馈形式非常有限。在这些数据集上评估的推荐系统模型往往缺乏实用性,难以为大规模真实场景应用提供足够的价值。
机器之心
2022/12/16
1.1K0
覆盖四种场景、包含正负向反馈,腾讯、西湖大学等发布推荐系统公开数据集Tenrec
三年、四大顶会,深度推荐系统18篇论文只有7个可以复现
作者 | 深度传送门 来源 | 深度传送门(ID:gh_5faae7b50fc5) 导读:本文是“深度推荐系统”专栏的第十篇文章,这个系列将介绍在深度学习的强力驱动下,给推荐系统工业界所带来的最前沿的
AI科技大本营
2019/09/17
1.4K0
三年、四大顶会,深度推荐系统18篇论文只有7个可以复现
推荐系统(二十一)DIN系列——DIN、DIEN、DSIN深度兴趣网络总结
本文为阿里DIN系列方法的简单总结,这里将会总结DIN系列文章的创新之处,以及相应的方法。DIN提出的原因我们在base model里面介绍。
秋枫学习笔记
2022/09/19
3.4K0
深度学习在推荐系统上的应用
深度学习最近大红大紫,深度学习的爆发使得人工智能进一步发展,阿里、腾讯、百度先后建立了自己的AI Labs,就连传统的厂商OPPO、VIVO都在今年开始筹备建立自己的人工智能研究所。 确实深度学习很火,近期深度学习的战火烧到推荐系统,其强大的表征能力和低准入门槛,已经成为各大高校和中国人改网络发paper的红利时代。可是我还没能发上那么几篇,之前面试大厂的AI labs被总监虐,感觉工作之后被压榨太多,快干了。 推荐系统为什么引入深度学习? 为什么我们会想到使用深度学习去处理推荐系统里面的事情呢,推荐系统从
AI研习社
2018/03/16
1.8K0
深度学习在推荐系统上的应用
SIGIR'22「平安」会话推荐:需求感知的图神经网络
预备知识:双线性函数:https://blog.csdn.net/xpy870663266/article/details/105465315
秋枫学习笔记
2022/09/19
5480
SIGIR 2022 | 推荐系统相关论文分类整理
ACM SIGIR 2022是CCF A类会议,人工智能领域智能信息检索( Information Retrieval,IR)方向最权威的国际会议。会议专注于信息的存储、检索和传播等各个方面,包括研究战略、输出方案和系统评估等等。第45届国际计算机学会信息检索大会(The 45rd International ACM SIGIR Conference on Research and Development in Information Retrieval, SIGIR 2022)计划于今年7月11日-7月15日在西班牙马德里召开。这次会议共收到794篇长文和667篇短文投稿,有161篇长文和165篇短文被录用,录用率约为20%和24.7%。官方发布的接收论文列表:
对白
2022/05/17
1.7K1
SIGIR 2022 | 推荐系统相关论文分类整理
正反馈+负反馈还不够,还有【中性反馈】
本文主要针对新闻网站对匿名读者(没注册的游客)进行新闻推荐的场景,访客和文章之间的交互仅限于临时登录会话。以前的工作倾向于将基于会话的推荐制定为下一个商品预测任务,而忽略了用户行为的隐含反馈,即用户真正喜欢或不喜欢什么。因此,本文提出了一个综合框架,通过正反馈(即他们花更多时间阅读的文章)和负反馈(即他们选择跳过而不点击的文章)来模拟用户行为。并且该框架使用会话开始时间隐含地对用户进行建模,并使用其初始发布时间对文章进行建模,称之为“中性反馈”。
秋枫学习笔记
2022/09/19
1.2K0
推荐阅读
相关推荐
专栏 | 9 篇顶会论文解读推荐中的序列化建模:Session-based Neural Recommendation
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档