Loading [MathJax]/jax/output/CommonHTML/jax.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >批次归一化能代替RNN中的tanh吗?

批次归一化能代替RNN中的tanh吗?
EN

Data Science用户
提问于 2021-04-04 17:01:03
回答 1查看 163关注 0票数 1

问题

批归一化(BN)能在后和后插入RNN中去除和偏置吗?如果可能的话,这会消除爆炸和消失的梯度问题吗?

笔者认为,tanh[-inf, +inf]值调整为(-1, 1)值的效果可以被BN的标准化所取代,使的偏差不再存在。

tanh的自动差别化也可以用BN来代替。

背景

据说它解决了RNN中的爆炸梯度问题,因此它正在被使用。

考虑到重复的反向传播机制,递归神经网络的一个问题是潜在的爆炸梯度.在加法算子之后,c(t)的绝对值可能大于1。通过一个tanh算子可以保证该值再次在-1到1之间进行缩放,从而增加了在多个时间步长的反向传播过程中的稳定性。

消失梯度问题是RNN中的主要问题。此外,为了保持激活函数的线性区域的梯度,我们需要一个二阶导数在达到零之前能维持很长时间的函数。Tanh对这些特性很在行。

批归一化可以同时解决爆炸和消失梯度问题。

求解消失梯度问题。虽然内部协变量偏移可能不能提高精度,但它在一定程度上涉及到消失梯度问题。当输入的分布发生变化时,由于激活函数(例如,sigmoid,将微小值设为±2.5,或ReLU,它将任何x<0设置为0),它将容易发生本质上较小的梯度更新。批归一化有助于确保在反向传播过程中,通过将分布从网络的末端转移到网络的开始,可以听到信号,而不是减少信号。求解爆炸梯度问题。当批量归一化平滑优化景观时,它消除了累积的极端梯度,从而消除了梯度积累导致的主要权重波动。这极大地稳定了学习。

Research

有几篇文章和文章指出这是可能的,但却找不到一个简单的实现图或代码示例。

对于RNN来说,这意味着计算小批处理和时间/步骤维度上的相关统计数据,因此规范化只适用于向量深度。这也意味着您只批量标准化转换后的输入(因此在垂直方向,例如BN(W_x * x)),因为横向(跨时间)连接是时间依赖的,不应该只是简单地平均化。

我们提出了一种LSTM的重参数化方法,它给递归神经网络带来了批量归一化的好处。鉴于以往的工作仅将批归一化应用于RNN的输入到隐藏的转换,我们证明了批量规范化隐隐转换是可能的,也是有益的,从而减少了时间步长之间的内部协变量转移。虽然批处理标准化在前馈网络中显示了显着的培训速度和泛化效益,但事实证明在递归架构中难以应用(Laurent等人,2016;Amodei等人,2015年)。它发现在堆叠的RNN中使用有限,其中规范化是“垂直”的,即每个RNN的输入,而不是时间步骤之间的“水平”。RNN在时间方向上更深,因此,当水平应用时,批处理规范化将是最有益的。然而,Laurent等人。(2016)假设以这种方式应用批量归一化会影响训练,因为重复重新标度会导致梯度的爆炸。我们的发现与这一假设背道而驰。我们证明,在递归模型隐-隐转换中应用批归一化是可能的,也是非常有益的。

EN

回答 1

Data Science用户

发布于 2022-12-13 11:25:51

垂直BN是可以的,但水平后隐藏的状态向量,我们需要层规范化,而不是tanh,这是我今天将要尝试的。然后我猜隐藏状态是0,2辍学。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/92556

复制
相关文章
获取git的提交内容
  Qt君最近工作需要发布一款软件,可是遇到了些问题。需要为软件写版本描述,但版本修改内容都在git的每个commit里面,用手动复制显然太浪费时间,不值得。
Qt君
2019/12/27
2.7K0
Jenkins: 获取文件变更列表、提交ID、提交人和提交信息
Jenkins — Get the latest changed files list, Commit ID, AuthorName, and Commit Message
DevOps云学堂
2022/12/29
2.9K0
Jenkins: 获取文件变更列表、提交ID、提交人和提交信息
从mysql获取到从redis获取 示例
1.因采集是每分钟写入一次数据库,故redis每分钟读取一次数据库最新信息,读取脚本如下:
葫芦
2019/04/13
2.4K0
从mysql获取到从redis获取 示例
flask使用request获取表单提交数据和获取url
web开发免不了需要获取用户提交的数据,Flask为我们提供了request对象来获取用户提交给服务器的数据。 下面是一个最基本的获取数据的例子:
菲宇
2022/05/06
3.1K0
SVN 命令行获取提交日志
可以看到,每次基本只能显示一条记录,大致是给定的日期开始时的最新版本的提交日志,所以获取的是给定日期前(前一天或更早之前)。但是有一个参数为当天(20220720)的,获取结果为空,不知何故。
独立观察员
2022/12/06
1.4K0
SVN 命令行获取提交日志
html获取表单提交数据_提交表单的两种方法
转载于:https://blog.csdn.net/yongwoozzang/article/details/83029128
全栈程序员站长
2022/11/08
2.7K0
Egg 中获取 POST 提交的数据
用过Koa的码农都知道,在Koa中获取POST提交的数据需要配置第三方的中间件,而Egg继承于Koa,在这一方面做了优化,获取POST提交的数据不需要再配置其它的中间件了,并添加了安全机制 CSRF 的防范,在Egg中获取用户提交的POST数据主要有以下两种方法。
越陌度阡
2020/11/26
1.6K0
从记录获取
Record.FieldCount(record as record) as number
逍遥之
2020/03/23
1.2K0
React技巧之表单提交获取input值
原文链接:https://bobbyhadz.com/blog/react-get-form-input-value-on-submit[1]
chuckQu
2022/08/19
1.6K0
React技巧之表单提交获取input值
python 从mysql获取变为redis获取
1.因采集是每分钟写入一次数据库,故redis每分钟读取一次数据库最新信息,读取脚本如下:
葫芦
2019/04/17
3.3K0
python 从mysql获取变为redis获取
[android] 从gallery获取图片
调用Intent对象的setAction()方法,设置动作,参数:Intent.ACTION_PICK
唯一Chat
2019/09/10
1.4K0
JQuery获取form表单数据及数据提交
JQuery获取表单数据 <form id="form-box">   ... </form> JSON字符串格式: let json = $('#form-box').serialize(); console.log('json: ', json); // 输出:json:name=w3h5&type=web 对象格式: let data = {}; let value = $('#form-box').serializeArray(); $.each(value, function (index, i
德顺
2020/12/10
7.8K0
后端获取不到axios.post提交的参数
部署运行项目后,发现后端这两个方法获取参数都是为null,后端又不想变更,于是前端想着怎么来解决这个问题。
青山师
2023/05/05
1.4K0
BlackCat勒索软件声称从Reddit 窃取了80GB的数据
据Security Affairs 6月18日消息,曾于今年2月5日攻击流行社交新闻聚合平台Reddit的幕后主使于近日浮出水面,BlackCat(又名 ALPHV)勒索软件组织发布消息称对这起网络攻击负责。
FB客服
2023/08/08
2130
BlackCat勒索软件声称从Reddit 窃取了80GB的数据
PHP获取当前页面的FORM表单提交
因为制作页面需求,需要在当前页面用php来响应,不做跳转。所以,研究了一下当前页面获取form表单提交的数据!
小唐同学.
2022/03/07
2.9K0
JQuery获取form表单数据及数据提交
未经允许不得转载:w3h5-Web前端开发资源网 » JQuery获取form表单数据及数据提交
德顺
2023/08/25
4550
C#网络爬虫实例:使用RestSharp获取Reddit首页的JSON数据并解析
Reddit 是一个非常受欢迎的分享社交新闻聚合网站,用户可以在上面发布和内容。我们的目标是抓取 Reddit 首页的数据 JSON,以便进一步分析和使用。
小白学大数据
2023/10/16
4600
如何从Facebook获取流量?
译者:Nic 审校:陈明艳 本文长度为4634字,预估阅读时间10分钟。 前言:作为重要的流量来源的Facebook,流量中究竟蕴藏了什么秘密,让我们一探究竟! Facebook带来数量相当可观
iCDO互联网数据官
2018/03/05
5.2K0
如何从Facebook获取流量?
【爬虫】获取Github仓库提交纪录历史的脚本 python
本脚本为第一版开发;后续会进行扩展 #! python3 import requests import time, datetime import json from colorama import Fore,Back,Style,init from bs4 import BeautifulSoup process = 0 output = 0 def req(type,addr,data='',**args): if type == 'get': try:
Mirror王宇阳
2020/12/16
1.4K0
Python开发实战教程(8)-向网页提交获取数据
Python应用现在如火如荼,应用范围很广。因其效率高开发迅速的优势,快速进入编程语言排行榜前几名。本系列文章致力于可以全面系统的介绍Python语言开发知识和相关知识总结。希望大家能够快速入门并学习Python这门语言。
做全栈攻城狮
2018/12/20
8850

相似问题

获取Reddit提交的正文?

11

从reddit获取图像

10

如何使用API获取Reddit提交的评论?

15

Reddit提交API 500错误

10

如何从reddit获取随机帖子

120
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档