前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Xavier 初始化方法

Xavier 初始化方法

作者头像
刘笑江
发布2019-12-30 16:24:45
1K0
发布2019-12-30 16:24:45
举报
文章被收录于专栏:刘笑江的专栏刘笑江的专栏

Standard Init

其中

是第 i 层的输入节点。

在 Xavier Init 提出前,一般用 unsupervised pre-trainning 和 greedy layer-wise procedure 来训练神经网络。

Xavier Init

其中

是第 i 层的输入、输出节点,以下是推导过程。

推导过程

卷积层的输入层

,输出为

根据概率公式,

的方差可以展开为

假设输入

和权重

的均值都为 0,上式可以简化为

假设输入

和权重

独立同分布,则有

由约束条件:【输入输出方差一致】,推导出

对一个多层网络,某一层的方差,可以用累积的形式表达

反向传播计算梯度,也有类似的形式

由约束条件:【前向传播与反向传播每一层的方差一致】,推导出

一般输入输出节点不相等,作为权衡有

由统计学定公式,

区间均匀分布,方差为

推导出 Xavier 初始化公式,符合正态分布

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019-03-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Standard Init
  • Xavier Init
  • 推导过程
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档