前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >为了加速参数收敛。

为了加速参数收敛。

原创
作者头像
serena
发布于 2022-07-18 02:54:25
发布于 2022-07-18 02:54:25
5020
举报
文章被收录于专栏:社区的朋友们社区的朋友们

梯度消失(vanishing gradient)和爆炸(exploding gradient)

根据深度学习中参数更新,采用梯度下降策略会运用反向传播,而由于深度学习中网络层数肯定不止一层,根据链式求导法则,我们对浅层参数的求导会有一个连乘操作,前面层的梯度是来自于后面层梯度的乘积。

如果网络层中多层的梯度均大于1,穿过多层后求出的梯度更新会以指数形式增加(前面层的更新速度远远快于后面层)就属于梯度爆炸现象;反之如果多层梯度均小于1,前面层的更新速度远低于后面层,更新特缓慢,那么就属于梯度消失现象。

梯度消失和梯度爆炸均会引起训练不稳定。

zero-centered

很多地方会提出希望网络层的输入是zero-centered零均值化的,包括数据预处理我们也通常会讲输入数据进行一个归一化,那么数据以0为中心有什么好处呢?

为了加速参数收敛。

假设我们的网络定义为:梯度消失(vanishing gradient)和爆炸(exploding gradient)

根据深度学习中参数更新,采用梯度下降策略会运用反向传播,而由于深度学习中网络层数肯定不止一层,根据链式求导法则,我们对浅层参数的求导会有一个连乘操作,前面层的梯度是来自于后面层梯度的乘积。

如果网络层中多层的梯度均大于1,穿过多层后求出的梯度更新会以指数形式增加(前面层的更新速度远远快于后面层)就属于梯度爆炸现象;反之如果多层梯度均小于1,前面层的更新速度远低于后面层,更新特缓慢,那么就属于梯度消失现象。

梯度消失和梯度爆炸均会引起训练不稳定。

zero-centered

很多地方会提出希望网络层的输入是zero-centered零均值化的,包括数据预处理我们也通常会讲输入数据进行一个归一化,那么数据以0为中心有什么好处呢?

为了加速参数收敛。

假设我们的网络定义为:梯度消失(vanishing gradient)和爆炸(exploding gradient)

根据深度学习中参数更新,采用梯度下降策略会运用反向传播,而由于深度学习中网络层数肯定不止一层,根据链式求导法则,我们对浅层参数的求导会有一个连乘操作,前面层的梯度是来自于后面层梯度的乘积。

如果网络层中多层的梯度均大于1,穿过多层后求出的梯度更新会以指数形式增加(前面层的更新速度远远快于后面层)就属于梯度爆炸现象;反之如果多层梯度均小于1,前面层的更新速度远低于后面层,更新特缓慢,那么就属于梯度消失现象。

梯度消失和梯度爆炸均会引起训练不稳定。

zero-centered

很多地方会提出希望网络层的输入是zero-centered零均值化的,包括数据预处理我们也通常会讲输入数据进行一个归一化,那么数据以0为中心有什么好处呢?

为了加速参数收敛。

假设我们的网络定义为:

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
AAAI2021 微信看一看的强化学习推荐HRL-Rec
本文基于AAAI-2021论文《Hierarchical Reinforcement Learning for Integrated Recommendation》。
Houye
2021/04/22
1.4K0
AAAI2021 微信看一看的强化学习推荐HRL-Rec
微信看一看实时相关推荐介绍
作者:谢若冰,腾讯微信研究员 在推荐系统中,用户在一个时间段经常会关注同一个主题。当用户读完一篇文章时,他往往会想要继续阅读和这篇文章相关的拓展文章。然而,传统的推荐系统feed流难以提供这种深度的拓展阅读(相关阅读)功能。这是由于考虑到推荐系统多样性和兴趣试探的要求,主推荐流中的文章往往是经过多种推荐/召回逻辑组成的,代表了用户的不同(潜在)兴趣,很少会出现同一个主题的文章连续出现的情况。 在这类工作中,我们提出了一种新的任务——相关推荐(relevant recommendation sugge
腾讯技术工程官方号
2021/04/09
1.5K0
用上GAN的推荐算法成精了,看完视频马上刷出相关文章丨KDD 2021
萧箫 整理自 KDD 2021 量子位 报道 | 公众号 QbitAI 这年头,推荐算法真是越来越智能了。 举个栗子,当你热衷于东京奥运会并且刷了不少剪辑视频,APP就会根据你的品味为你推荐文章、游戏或是同款周边。 没错,推荐算法早已不局限于一个场景,而是在视频、文章、小程序等各种场景中“打通任督二脉”,也就是多领域推荐算法。 但事实上,这类算法并不如想象中容易驾驭,关键在于如何抓住不同领域中,关于目标领域的有效特征。 为了让推荐算法更了解你,腾讯微信的看一看团队,针对多领域推荐任务提出了一个全新的模型,
量子位
2023/03/10
2750
用上GAN的推荐算法成精了,看完视频马上刷出相关文章丨KDD 2021
清华、斯坦福、哈佛揭秘:为何沉迷拼多多「砍一刀」
---- 新智元报道   编辑:好困 【新智元导读】你有没有刷手机时一不留神就忍不住剁手?沉迷「砍一刀」无法自拔? 没想到在「买买买」这件事上,来自清华大学电子系数据科学与智能实验室联合斯坦福大学、哈佛商学院、京都大学、香港城市大学等机构的研究人员,竟然做了一系列深入的研究。 相关成果已经发表在了该交叉研究涉及的社会计算、人机交互、信息检索等领域顶级国际会议与期刊, 包括CHI、CSCW、ICWSM、WWW、WSDM、SIGIR等论文十余篇。 图1 社交电商平台 社交电商 在线数字社交经济的典型
新智元
2022/05/09
6010
清华、斯坦福、哈佛揭秘:为何沉迷拼多多「砍一刀」
达观于敬:知识图谱增强下的智能推荐系统与应用
随着互联网技术的迅速发展,尤其是移动互联网的兴起,新产生的信息呈现爆炸式的增长。为了更好地解决信息获取中的信息过载(Information Overload)和长尾问题(Long Tail),推荐系统应运而生,目前基本上已经成为了各种产品的标配功能。推荐系统是信息过滤系统的一个分支,它可以自动地挖掘用户和物品之间的联系。具体来说,它试图基于用户本身的多维度属性数据(如年龄、地域、性别等)以及行为数据的反馈(如点击、收藏、点赞、购买等),结合物品自身属性数据(如标题、标签、类别、正文等),以预测用户对待推荐物品的评分或偏好。从用户的角度来看,推荐系统是基于用户个人的兴趣偏好进行千人千面的自动推荐,则有助于缓解信息过载问题。从物品的角度来看,其自身属性及对应的交互行为差异,通过各种推荐方式是可以触达到对其更感兴趣的用户群体中,缓解了曝光不足带来的长尾问题。从企业的角度来看,推荐系统带来了更好的产品交互方式,达到了沉浸式体验的效果,从而进一步提升了用户的黏性,并最终大幅度提升了转化收益。
用户10103085
2022/11/17
9800
达观于敬:知识图谱增强下的智能推荐系统与应用
基于会话推荐系统最新长文综述,163篇参考文献,已被ACM Computing Surveys接收
本文给大家介绍一篇刚被 ACM 旗舰期刊 ACM Computing Surveys (CSUR) 接收的基于会话推荐系统 (Session-based Recommender Systems (SBRS)) 的综述长文。ACM Computing Surveys 是计算机学科最具影响力的期刊之一,其最新影响因子为 7.99,为中科院认定的一区 Top 期刊,CORE Rank A* 期刊,主要发表计算机科学领域较有代表性的综述论文。
机器之心
2021/06/08
7560
微信「看一看」 推荐排序技术揭秘
本文转载自:微信AI,作者 xiafengxia 在微信 AI 背后,技术究竟如何让一切发生?微信 AI 公众号推出技术专题系列“微信看一看背后的技术架构详解”,干货满满,敬请关注。以下为专题的第一篇《微信看一看推荐排序》。 一、背景 微信公众平台作为目前用户量最大的互联网原创内容平台之一,每日新发表的文章可达几百万篇。用户可以通过关注公众号、朋友圈、聊天转发等渠道阅读文章。除了前述几种方式以外,用户很难再有其他方式发现更多有趣的文章。因此,看一看个性化推荐应运而生。我们利用用户在微信内的阅读、关注、
腾讯技术工程官方号
2020/07/13
2.9K0
TKDE2022 | 最新深度学习推荐系统综述:从协同过滤到信息增强的推荐系统
深度学习技术已经在计算机视觉以及自然语言理解等领域取得了巨大的成功,受其影响深度学习研究也开始在推荐系统领域得到关注。近些年来,已经见证了基于神经网络的推荐系统的巨大进步,其已经超越了传统推荐模型的性能。不同于之前文献[1][2]基于深度模型的结构进行综述(比如以MLP、CNN、RNN等进行分类),也不同于之前文献对于某一子领域进行综述[3][4](比如跨域推荐、知识图谱推荐等),本文以推荐模型的准确性为目标,从推荐模型的角度对神经推荐模型进行了系统的综述,旨在总结该领域的研究成果,为研究推荐系统的研究者和实践者提供参考。具体来说,根据推荐模型建模所利用的数据进行分类,把当前的工作分为了基于协同过滤的方法和基于信息增强的方法。另外,把基于信息增强的方法又进一步分为了内容增强的方法和基于时序/序列的推荐方法,下文将对上述方法进行详细介绍。
张小磊
2022/04/11
5.6K0
TKDE2022 | 最新深度学习推荐系统综述:从协同过滤到信息增强的推荐系统
WWW2021 微信的多目标推荐任务PAPERec
本文基于WWW-2021论文《Personalized Approximate Pareto-Efficient Recommendation》。
Houye
2021/04/22
2.7K0
WWW2021 微信的多目标推荐任务PAPERec
使用深度学习构建先进推荐系统:近期33篇重要研究概述
选自arXiv 作者:Ayush Singhal、Pradeep Sinha、Rakesh Pant 机器之心编译 除了计算机视觉和自然语言处理,深度学习近年来在推荐系统上也取得了引人关注的结果。事实上,Spotify、Netflix、Facebook、谷歌等公司早已对深度学习推荐系统有过深入研究,并在实际应用中取得了很好的效果。来自 Contata Solutions 的研究人员发表在 IJCA 上的概述论文对这些研究进行了梳理。 论文:Use of Deep Learning in Modern Rec
机器之心
2018/05/11
1K0
基于评论文本的深度推荐系统总结
本文主要总结下近几年结合评论文本的推荐系统 (Review-based Recommendation),侧重深度学习的模型,并且开源了一个代码库: Neu-Review-Rec(https://github.com/ShomyLiu/Neu-Review-Rec) 主要完成了数据处理,模型构建,baseline复现等完整的Pipeline。
张小磊
2020/05/08
3.4K0
基于评论文本的深度推荐系统总结
超级干货 :一文读懂社交网络分析
社交网络在维基百科的定义是“由许多节点构成的一种社会结构。节点通常是指个人或组织,而社交网络代表着各种社会关系。”在互联网诞生前,社交网络分析是社会学和人类学重要的研究分支。早期的社交网络的主要指通过合作关系建立起来的职业网络,如科研合作网络、演员合作网络等。
IT阅读排行榜
2018/08/17
3.4K0
超级干货 :一文读懂社交网络分析
一文了解推荐系统中的图神经网络
引言:近年来,GNN技术由于其在图数据学习方面的出色表现,在许多领域得到了广泛的应用。在推荐系统中,大部分信息本质上具有图结构,而由于GNN对于表示学习具有一定的优势,所以GNN在推荐系统相关领域的应用迅速发展。本文尽可能用通俗的语言代替算法公式来进行讲述,希望可以让读者对推荐系统中的图神经网络有一个基本的了解。
张小磊
2021/09/02
3.7K0
一文了解推荐系统中的图神经网络
CSUR2022 | 基于图神经网络的推荐系统综述, 211篇参考文献
ACM Computing Surveys (CSUR) 中文全称为美国计算机学会计算概观,是计算机学科最具影响力的期刊之一。作为计算机科学、理论和方法的综述类顶刊,其 2020 影响因子 10.282,该期刊主要发表计算机科学领域较有代表性的综述论文。PKU-DAIR 实验室研究成果 Graph Neural Networks in Recommender Systems: A Survey 已被 ACM Computing Surveys 接收。
张小磊
2022/05/26
2.8K0
CSUR2022 | 基于图神经网络的推荐系统综述, 211篇参考文献
WWW2023 | 基于去噪对比学习的序列推荐
TLDR: 本文提出了一种新的去偏的对比学习范式DCRec,以解决在序列推荐中引入对比学习机制而造成或者加重的流行度偏差问题。作者设计了一个多通道网络来建模用户在序列行为上表现出的从众程度(conformity),并且以用户的从众程度为权重,动态地增强序列编码与图编码的用户兴趣建模之间的对比学习机制。在后者中,本文设计两种全局的图编码方式:序列图与协同图,来反映用户兴趣的从众部分和个性化部分。DCRec可以学习自适应的对比学习权重,来平衡用户从众表示和个性化兴趣表示的增强程度,以实现去偏化对比学习的优势。
张小磊
2023/09/10
1.3K0
WWW2023 | 基于去噪对比学习的序列推荐
当推荐系统邂逅深度学习
推荐系统之于用户的角色,有时更像是无微不至的男朋友,你口渴时递给你符合口味的饮料,你饥饿时还你以常吃的披萨,你无聊时帮你推荐有趣的音乐亦或带你欣赏感兴趣的电影。
张小磊
2019/08/16
8080
当推荐系统邂逅深度学习
东北大学-腾讯微信看一看团队ACM RecSys2023最佳短文解读
全球推荐系统领域顶级会议ACM RecSys于9月18-22日在新加坡举行。东北大学与腾讯微信看一看团队针对推荐系统中用户留存优化的最新研究论文“Interpretable User Retention Modeling in Recommendation” 获得大会最佳短文奖(Best Short Paper Award)。该论文由入选2022犀牛鸟精英人才计划的丁蕊同学在学界导师杨晓春教授和微信看一看谢若冰高级研究员的联合培养下主要完成。
腾讯技术工程官方号
2023/10/27
1.1K0
东北大学-腾讯微信看一看团队ACM RecSys2023最佳短文解读
独家 | 一文读懂社交网络分析-下(应用、前沿、学习资源)
本文主要阐述: 社交网络分析的应用 社交网络前沿研究 学习资料 参考资料 浏览前三章的内容请见上篇(2017年9月26日头条)。 四. 社交网络分析的应用 1. 社交推荐 社交推荐顾名思义是利用社交网络或者结合社交行为的推荐,具体表现为推荐 QQ 好友,微博根据好友关系推荐内容等。在线推荐系统最早被亚马逊用来推荐商品,如今,推荐系统在互联网已无处不在,目前大热的概念“流量分发是互联网第一入口”,支撑这个概念有两点核心,其一是内容,另外就是推荐,今日头条在短短几年间的迅速崛起便是最好的证明。 根据推荐
数据派THU
2018/01/30
2K0
独家 | 一文读懂社交网络分析-下(应用、前沿、学习资源)
社会化推荐浅谈
不知道大家有没有这样的感觉,本人一直觉得社交网络这个东西是一个很有意思的玩意儿,起初觉得它有意思也可能是由于这个可爱的名词-Social Network,也可能是被五颜六色的社交网络示意图所吸引,总之并没有什么高大上的名词来解释我对于它的喜爱。也正是由于这种莫名的好感,基于社交网络的推荐系统也成了我后来硕士阶段研究的课题。随着后续学习与研究的深入,逐渐了解到了社交网络中包含的有意思的结论以及所蕴含的强大知识,也更加确定了自己对于这一领域的喜欢。
张小磊
2019/12/25
9930
深度学习技术在社会化推荐场景中的总结
不知道大家有没有感觉,在日常生活中用到推荐一词的时候经常是用在社交场景中的。到一个地方旅游让朋友推荐一下旅游景点,学习某一项技术的时候让朋友推荐一些有什么书可以看。在众多推荐系统的方向中,我觉得社会化推荐这一分支更加符合现实生活中的情况。而自从深度学习技术在计算机视觉、自然语言处理中大放异彩,许多研究者也将深度学习技术运用到了社会化推荐领域中。
张小磊
2020/08/26
7030
深度学习技术在社会化推荐场景中的总结
推荐阅读
相关推荐
AAAI2021 微信看一看的强化学习推荐HRL-Rec
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档