Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >为了加速参数收敛。

为了加速参数收敛。

原创
作者头像
serena
发布于 2022-07-18 02:54:25
发布于 2022-07-18 02:54:25
5020
举报
文章被收录于专栏:社区的朋友们社区的朋友们

梯度消失(vanishing gradient)和爆炸(exploding gradient)

根据深度学习中参数更新,采用梯度下降策略会运用反向传播,而由于深度学习中网络层数肯定不止一层,根据链式求导法则,我们对浅层参数的求导会有一个连乘操作,前面层的梯度是来自于后面层梯度的乘积。

如果网络层中多层的梯度均大于1,穿过多层后求出的梯度更新会以指数形式增加(前面层的更新速度远远快于后面层)就属于梯度爆炸现象;反之如果多层梯度均小于1,前面层的更新速度远低于后面层,更新特缓慢,那么就属于梯度消失现象。

梯度消失和梯度爆炸均会引起训练不稳定。

zero-centered

很多地方会提出希望网络层的输入是zero-centered零均值化的,包括数据预处理我们也通常会讲输入数据进行一个归一化,那么数据以0为中心有什么好处呢?

为了加速参数收敛。

假设我们的网络定义为:梯度消失(vanishing gradient)和爆炸(exploding gradient)

根据深度学习中参数更新,采用梯度下降策略会运用反向传播,而由于深度学习中网络层数肯定不止一层,根据链式求导法则,我们对浅层参数的求导会有一个连乘操作,前面层的梯度是来自于后面层梯度的乘积。

如果网络层中多层的梯度均大于1,穿过多层后求出的梯度更新会以指数形式增加(前面层的更新速度远远快于后面层)就属于梯度爆炸现象;反之如果多层梯度均小于1,前面层的更新速度远低于后面层,更新特缓慢,那么就属于梯度消失现象。

梯度消失和梯度爆炸均会引起训练不稳定。

zero-centered

很多地方会提出希望网络层的输入是zero-centered零均值化的,包括数据预处理我们也通常会讲输入数据进行一个归一化,那么数据以0为中心有什么好处呢?

为了加速参数收敛。

假设我们的网络定义为:梯度消失(vanishing gradient)和爆炸(exploding gradient)

根据深度学习中参数更新,采用梯度下降策略会运用反向传播,而由于深度学习中网络层数肯定不止一层,根据链式求导法则,我们对浅层参数的求导会有一个连乘操作,前面层的梯度是来自于后面层梯度的乘积。

如果网络层中多层的梯度均大于1,穿过多层后求出的梯度更新会以指数形式增加(前面层的更新速度远远快于后面层)就属于梯度爆炸现象;反之如果多层梯度均小于1,前面层的更新速度远低于后面层,更新特缓慢,那么就属于梯度消失现象。

梯度消失和梯度爆炸均会引起训练不稳定。

zero-centered

很多地方会提出希望网络层的输入是zero-centered零均值化的,包括数据预处理我们也通常会讲输入数据进行一个归一化,那么数据以0为中心有什么好处呢?

为了加速参数收敛。

假设我们的网络定义为:

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
SHEIN被“偷师”,高估值难再现?
中国跨境电商独角兽SHEIN (希音)一向闷声赚大钱,不过《金融时报》的一则报道,还是将其最新动向公之于众。
华尔街科技眼
2023/02/22
3240
SHEIN被“偷师”,高估值难再现?
D2C品牌独立站三大核心能力:流量、供应链与品牌&产品力
在研究D2C模式的过程中,「庄帅零售电商频道」发现一个有意思的现象,那就是几乎所有开放平台(包括电商、社交和内容)都将自己称之为最适合品牌商做D2C的平台。
庄帅
2022/10/20
8130
D2C品牌独立站三大核心能力:流量、供应链与品牌&产品力
击败H&M,颠覆ZARA,千亿巨头Shein如何快速崛起?
据可靠消息,快时尚电子商务公司Shein近日正在筹集至少10亿美元的最新一轮融资,在本轮融资后,Shein的估值可能高达1000亿美元。千亿美元估值是个什么样的概念呢?即放眼国内未上市的新经济公司,超千亿美元估值的也仅有字节跳动、蚂蚁金服和阿里云三家。相比于上一轮融资,只用了一年半,Shein的估值就翻了近7倍,排名跃升了20位,增长速度一骑绝尘。
数商云
2022/04/18
4750
击败H&M,颠覆ZARA,千亿巨头Shein如何快速崛起?
服装撞上AI,美图、云快反、SHEIN“枕戈待旦”
过去几年,国潮风口带动了汉服、马面裙、旗袍等等不少“新中式”服装的兴盛,有的商家借此契机赚了个盆满钵满,也有的商家苦于追不上风口。
刘旷
2024/04/22
1960
阿里电商,挥剑指向欧美
近年来随着人们消费观念的转变以及对境外优质产品的渴望,整个跨境电商行业迎来了飞速发展。尤其是在疫情的影响下,跨境电商凭借低成本、高效率、突破时空限制、高标准满足用户需求的强大优势,受到了全球消费者的青睐。
刘旷
2021/10/22
6490
服装快反供应链不是“瞎快”,背后要有数据做基础
柔性供应链的概念最早始于 1990 年代末,但直到 2010 年左右,才在中国市场被关注和普及。回溯起来,2010 年前后的确是一个比较特殊的时间点——电商迅速崛起,消费者开始在买卖交易中占据主导,同时,海外品牌大举进入中国市场,国内竞争压力骤升。 对于服装品牌商来说,把商品企划、设计、生产、销售等环节拉长到以年为周期的传统模式,在这一背景下逐渐失去竞争力。尤其是在“双 11”这样的电商大促活动中,传统集中式的订货模式完全失效。于是,“柔性快反供应链”成为品牌商应对前端运营不确定性的产物,它强调服装商品全生命周期、全链条各环节的一体化紧密协同,通常是以月或者周为单位做 PDCA 循环 (即计划 -Plan, 执行 -Do, 检查 -Check, 处理 -Act)。 但是,所谓“快反”,并不是盲目地“快”,背后要有数据作为依据和基础,适应业务有计划有策略的快。柔性快反供应链的打造,与数字化息息相关。 裂帛是国内的原创设计女装品牌,也是最早的互联网品牌之一。在 2012 年的“双 11”中,裂帛更是拿下了当天天猫销量的第一。作为“原生”的线上品牌,裂帛更早地遇到了订单处理、仓库发货以及供应链管理上的瓶颈,因此,从 2010 年开始,裂帛就投入大量资源做 B2C 网站、电商 ERP、电商供应链等系统等自主技术研发。 据裂帛股份副总裁、现任新物云 CEO 的大麦(王浩宇)在最新一期的 InfoQ《超级连麦. 数智大脑》中介绍,2016 年起,这些技术积淀逐渐从裂帛孵化出来,通过新的科技公司新物云,目前已经向市场上 300 多个品牌实现了技术输出。
深度学习与Python
2022/11/28
9960
DNSPod十问洪培林:跨境电商的亚马逊出逃记
问答时间:2021年9月16日 嘉宾简介:洪培林,深圳市电子商务服务中心主任助理兼部长。国内电子商务领域的知名专家,广东省电子商务协会专家委员会委员,深圳市跨境电子商务协会专家委员会委员,深圳市一带一路经贸战略研究院顾问。央视财经频道、凤凰卫视、深圳电视台、亚洲卫视等媒体特邀评论嘉宾。 主持人简介:吴洪声(人称:奶罩):腾讯云中小企业中心总经理,DNSPod创始人,洋葱令牌创始人,网络安全专家,域名及DNS技术专家,知名个人站长,中欧国际工商学院EMBA。 1 吴洪声:你之前说过中国的电子商务是全球最
腾讯云DNSPod团队
2021/09/18
7800
数字化技术,正在改写企业出海的游戏规则
中东土豪变身短视频平台上的外国“老铁”;老美爱上了“修仙”“霸总”小说;巴黎米兰少女抛弃ZARA爱上中国快时尚……这些意想不到的现象背后,是新一轮出海浪潮下,中国出海企业创下的战绩。
科技云报道
2022/08/31
2940
数字化技术,正在改写企业出海的游戏规则
政策扶持“中国制造”走出去,跨境出口电商运营方式多样化
经济全球化是世界经济发展的必然结果,也是全球经济发展的重要特征。在经济全球化的背景下,电子商务实现了跨越式发展,中国电商商务规模占据全球电商市场一半份额以上。
庄帅
2020/09/21
8440
政策扶持“中国制造”走出去,跨境出口电商运营方式多样化
木木西里崔远驰:互联网+数据资源 ,打造高品质科研供应链 | 镁客请讲
未来,木木西里还准备用大数据实现“产学研”对接,用高附加值产品满足科技发展的需要。 常言道,“巧妇难为无米之炊”,没有高质量、高品质的硬件设备,无论是高校、科研还是企业的产品研发都会寸步难行。 而当前国内科研仪器市场的现状是泥沙俱下,耗材产品假货泛滥,一些高科技研发的前沿仪器甚至没有购买渠道。 而木木西里正在这其中的桥梁,他们以O2O模式销售仪器、耗材、试剂等硬件产品,同时还关注着前沿产品的研发。 团队创业:努力存活下去 才有诗与远方 木木西里成立于2014年,创业核心团队是一群刚毕业的大学生。他们认真务实
镁客网
2018/05/30
6970
子不语IPO在即,亚马逊“寄生症”难解
今年双十一,港股将迎来“跨境鞋服第一股”——子不语预计于11月11日正式挂牌港交所,股票代码为02420.HK。
不二研究
2022/11/08
2880
豌豆公主,如何成为日本跨境电商的黑马?
2014年是跨境电商元年,宏观政策利好不断释放,消费升级大势不可阻挡,用户海淘习惯逐步养成,跨境电商迎来了高速发展。像网易考拉、京东全球购、天猫国际这样的有巨头资本背书的头部玩家都在做综合性跨境电商,垂直电商是否还有机会?在垂直赛道做重做深的豌豆公主就是一个典型。
罗超频道
2018/09/28
1.2K0
服装零售商数字化转型,从一条爆款牛仔裤说起
创业黑马牛文文的这句话曾一度成为企业转型和初创期的万能套话。在我们看来,所有新零售的巨头与有潜力的新兴品牌,都值得用数字化重做一遍。
浪潮新消费
2020/12/30
5870
服装库存是怎么产生的
好多人问我,你们做的服装管理软件能干啥?我说提升管理,降低库存积压。可以解决库存问题?一个软件可以解决库存问题?所有的人都表示怀疑,包括我自己的老婆也不明白其中的原因。写这篇文章,就是深入刨析一下库存产生的原因,为啥信息化可以解决这个问题。
用户5829239
2019/07/16
1.2K0
服装库存是怎么产生的
Temu加速出海 :内卷电商卷出内伤
2月9日,Temu在加拿大上线站点后仅仅一个月,Temu的触角就延伸至澳大利亚和新西兰市场。公开消息显示,Temu英国站计划于3月25日上线。而欧洲市场也在Temu的规划之中,或将在今年上半年上线。
华尔街科技眼
2023/03/15
5640
中国电商出海的“八十一难”
一个消息是拼多多旗下跨境电商平台Temu正式进入英国市场,过去几个月内已经先后扩展到加拿大、澳大利亚、新西兰等市场。
Alter聊科技
2023/04/27
1990
中国电商出海的“八十一难”
DNSPod十问Fanmart向勇:征战东南亚,跨境电商的新大陆?
问答时间:2020年01月07日 嘉宾简介: 向勇:重庆格洛博电子商务有限公司(GLOBAL)创始人兼总经理,国内知名数据分析专家、早期知名个人站长。有多年的技术研发经验和公司管理经验,擅长公司的运营管理和研发技术支持。GLOBAL旗下有东南亚出海电商平台FanMart和国内基于抖音快手为载体的新电商两块业务。FanMart为东南亚领先的B2C平台,其APP常年在多个国家排行榜前列,国内新电商业务日均20万单。 主持人简介: 吴洪声(人称:奶罩):腾讯云中小企业产品中心总经理,DNSPod创始人,洋
腾讯云DNSPod团队
2021/01/08
5760
图形学大牛归国投身产业,还是个让女孩们败家的赛道
杨净 发自 凹非寺 量子位 报道 | 公众号 QbitAI 王华民归国“创业”了! 最近,这则爆料轰动了图形学领域。 王华民是谁?俄亥俄州立大学终身教授,四届SIGGRAPH技术论文委员会委员,公认的世界级图形学科学家。 曾以唯一作者身份独立完成四篇SIGGRAPH论文——作为全球规模最大、影响最大的图形学会议,论文入选都很难,更不必说独立完成。 另外,斯坦福、UC伯克利等名校的图形学课程,王华民的论文也屡屡被指定为参考文献。 其学生更是遍布知名大厂,从硅谷的Google、Facebook、Adobe,到
量子位
2023/03/10
2620
图形学大牛归国投身产业,还是个让女孩们败家的赛道
从服装供应链看产业互联网的机会
中国服装产业在过去30年经历了高速增长-库存积压-存货出清-重新增长的几个周期,现今,产业各环节迎来新的机会与挑战。
张哥编程
2024/12/19
1210
从服装供应链看产业互联网的机会
响铃:淘品牌后生存时代,除了“绑架”网红还该干啥?
如今的电商已是个传统行业,依托淘宝商城成长起来的那些淘品牌依次上演了各自的兴亡记,如初裂帛并购天使之城,森马20亿元收购GXG,更多的如麦包包、绿盒子、芳草集等明星淘品牌或“出淘”或衰落。淘品牌似乎正陷入集体沉沦境地,只有韩都衣舍、裂帛、新农哥、歌瑞尔等少数几个品牌仍在继续前行。不可否认,淘品牌是淘宝流量红利的产物,但当红利渐失,微商、跨界电商、农村电商、网红电商等新生态前仆后继时,淘品牌如何才能在这次震荡和洗牌中跨过所谓的“生死线”,又如何才能获得重生?
曾响铃
2018/08/20
3350
推荐阅读
相关推荐
SHEIN被“偷师”,高估值难再现?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档