开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

社区首页 >专栏 >Xavier 初始化方法

Xavier 初始化方法

刘笑江

发布于 2019-12-30 16:24:45

1K0

发布于 2019-12-30 16:24:45

举报

文章被收录于专栏：刘笑江的专栏刘笑江的专栏

Standard Init

其中

是第 i 层的输入节点。

在 Xavier Init 提出前，一般用 unsupervised pre-trainning 和 greedy layer-wise procedure 来训练神经网络。

Xavier Init

其中

是第 i 层的输入、输出节点，以下是推导过程。

推导过程

卷积层的输入层

，输出为

。

根据概率公式，

的方差可以展开为

假设输入

和权重

的均值都为 0，上式可以简化为

假设输入

和权重

独立同分布，则有

由约束条件：【输入输出方差一致】，推导出

对一个多层网络，某一层的方差，可以用累积的形式表达

反向传播计算梯度，也有类似的形式

由约束条件：【前向传播与反向传播每一层的方差一致】，推导出

一般输入输出节点不相等，作为权衡有

由统计学定公式，

在

区间均匀分布，方差为

推导出 Xavier 初始化公式，符合正态分布

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2019-03-21，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新

LV.

目录

Standard Init
Xavier Init
推导过程