Loading [MathJax]/jax/output/CommonHTML/jax.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >批次归一化能代替RNN中的tanh吗？

问批次归一化能代替RNN中的tanh吗？
EN

Data Science用户

提问于 2021-04-04 17:01:03

回答 1查看 163关注 0票数 1

问题

批归一化(BN)能在 $x_t@W_{xh}$ 后和 $h_{t-1}@W_{hh}$ 后插入RNN中去除 $f=tanh$ 和偏置 $b_h$ 吗？如果可能的话，这会消除爆炸和消失的梯度问题吗？

笔者认为，tanh将[-inf, +inf]值调整为(-1, 1)值的效果可以被BN的标准化所取代，使 $x_t@W_{xh}$ 和 $h_{t-1}@W_{hh}$ 的偏差不再存在。

批量归一化:通过减少内部协变量转移加速深度网络训练

tanh的自动差别化也可以用BN来代替。

背景

据说它解决了RNN中的爆炸梯度问题，因此它正在被使用。

为什么我们需要LSTM单元中的第二个tanh()

考虑到重复的反向传播机制，递归神经网络的一个问题是潜在的爆炸梯度.在加法算子之后，c(t)的绝对值可能大于1。通过一个tanh算子可以保证该值再次在-1到1之间进行缩放，从而增加了在多个时间步长的反向传播过程中的稳定性。

为什么在RNN中使用tanh？

消失梯度问题是RNN中的主要问题。此外，为了保持激活函数的线性区域的梯度，我们需要一个二阶导数在达到零之前能维持很长时间的函数。Tanh对这些特性很在行。

批归一化可以同时解决爆炸和消失梯度问题。

批次规范化:深度学习的最大突破

求解消失梯度问题。虽然内部协变量偏移可能不能提高精度，但它在一定程度上涉及到消失梯度问题。当输入的分布发生变化时，由于激活函数(例如，sigmoid，将微小值设为±2.5，或ReLU，它将任何x<0设置为0)，它将容易发生本质上较小的梯度更新。批归一化有助于确保在反向传播过程中，通过将分布从网络的末端转移到网络的开始，可以听到信号，而不是减少信号。求解爆炸梯度问题。当批量归一化平滑优化景观时，它消除了累积的极端梯度，从而消除了梯度积累导致的主要权重波动。这极大地稳定了学习。

Research

有几篇文章和文章指出这是可能的，但却找不到一个简单的实现图或代码示例。

在RNN和LSTM中使用批处理规范化是否正常？[封闭]

对于RNN来说，这意味着计算小批处理和时间/步骤维度上的相关统计数据，因此规范化只适用于向量深度。这也意味着您只批量标准化转换后的输入(因此在垂直方向，例如BN(W_x * x))，因为横向(跨时间)连接是时间依赖的，不应该只是简单地平均化。

经常性批归一化

我们提出了一种LSTM的重参数化方法，它给递归神经网络带来了批量归一化的好处。鉴于以往的工作仅将批归一化应用于RNN的输入到隐藏的转换，我们证明了批量规范化隐隐转换是可能的，也是有益的，从而减少了时间步长之间的内部协变量转移。虽然批处理标准化在前馈网络中显示了显着的培训速度和泛化效益，但事实证明在递归架构中难以应用(Laurent等人，2016；Amodei等人，2015年)。它发现在堆叠的RNN中使用有限，其中规范化是“垂直”的，即每个RNN的输入，而不是时间步骤之间的“水平”。RNN在时间方向上更深，因此，当水平应用时，批处理规范化将是最有益的。然而，Laurent等人。(2016)假设以这种方式应用批量归一化会影响训练，因为重复重新标度会导致梯度的爆炸。我们的发现与这一假设背道而驰。我们证明，在递归模型隐-隐转换中应用批归一化是可能的，也是非常有益的。

层归一化

batch-normalization

EN

回答 1

Data Science用户

发布于 2022-12-13 11:25:51

垂直BN是可以的，但水平后隐藏的状态向量，我们需要层规范化，而不是tanh，这是我今天将要尝试的。然后我猜隐藏状态是0,2辍学。

票数 0

EN

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/92556

复制

相关文章

获取git的提交内容

qt git awk commit 软件

Qt君最近工作需要发布一款软件，可是遇到了些问题。需要为软件写版本描述，但版本修改内容都在git的每个commit里面，用手动复制显然太浪费时间，不值得。

Qt君

2019/12/27

2.7K0

Jenkins: 获取文件变更列表、提交ID、提交人和提交信息

git shell jenkins

Jenkins — Get the latest changed files list, Commit ID, AuthorName, and Commit Message

DevOps云学堂

2022/12/29

2.9K0

Jenkins: 获取文件变更列表、提交ID、提交人和提交信息

从mysql获取到从redis获取示例

云数据库 Redis®数据库 sql

1.因采集是每分钟写入一次数据库，故redis每分钟读取一次数据库最新信息，读取脚本如下:

葫芦

2019/04/13

2.4K0

从mysql获取到从redis获取示例

flask使用request获取表单提交数据和获取url

http python html flask

web开发免不了需要获取用户提交的数据，Flask为我们提供了request对象来获取用户提交给服务器的数据。下面是一个最基本的获取数据的例子：

菲宇

2022/05/06

3.1K0

SVN 命令行获取提交日志

https 网络安全

可以看到，每次基本只能显示一条记录，大致是给定的日期开始时的最新版本的提交日志，所以获取的是给定日期前（前一天或更早之前）。但是有一个参数为当天（20220720）的，获取结果为空，不知何故。

独立观察员

2022/12/06

1.4K0

html获取表单提交数据_提交表单的两种方法

https 网络安全

转载于:https://blog.csdn.net/yongwoozzang/article/details/83029128

全栈程序员站长

2022/11/08

2.7K0

Egg 中获取 POST 提交的数据

javascript http koa 网络安全 html

用过Koa的码农都知道，在Koa中获取POST提交的数据需要配置第三方的中间件，而Egg继承于Koa，在这一方面做了优化，获取POST提交的数据不需要再配置其它的中间件了，并添加了安全机制 CSRF 的防范，在Egg中获取用户提交的POST数据主要有以下两种方法。

越陌度阡

2020/11/26

1.6K0

从记录获取

Record.FieldCount(record as record) as number

逍遥之

2020/03/23

1.2K0

React技巧之表单提交获取input值

https http 网络安全编程算法 react

原文链接：https://bobbyhadz.com/blog/react-get-form-input-value-on-submit[1]

chuckQu

2022/08/19

1.6K0

React技巧之表单提交获取input值

python 从mysql获取变为redis获取

云数据库 Redis®数据库 sql

1.因采集是每分钟写入一次数据库，故redis每分钟读取一次数据库最新信息，读取脚本如下:

葫芦

2019/04/17

3.3K0

python 从mysql获取变为redis获取

[android] 从gallery获取图片

调用Intent对象的setAction()方法，设置动作，参数：Intent.ACTION_PICK

唯一Chat

2019/09/10

1.4K0

JQuery获取form表单数据及数据提交

JQuery获取表单数据 <form id="form-box"> ... </form> JSON字符串格式： let json = $('#form-box').serialize(); console.log('json: ', json); // 输出：json：name=w3h5&type=web 对象格式： let data = {}; let value = $('#form-box').serializeArray(); $.each(value, function (index, i

德顺

2020/12/10

7.8K0

后端获取不到axios.post提交的参数

axios post 对象后端前端

部署运行项目后，发现后端这两个方法获取参数都是为null，后端又不想变更，于是前端想着怎么来解决这个问题。

青山师

2023/05/05

1.4K0

BlackCat勒索软件声称从Reddit 窃取了80GB的数据

reddit 博客软件数据网关

据Security Affairs 6月18日消息，曾于今年2月5日攻击流行社交新闻聚合平台Reddit的幕后主使于近日浮出水面，BlackCat(又名 ALPHV)勒索软件组织发布消息称对这起网络攻击负责。

FB客服

2023/08/08

2130

BlackCat勒索软件声称从Reddit 窃取了80GB的数据

PHP获取当前页面的FORM表单提交

php 编程算法

因为制作页面需求，需要在当前页面用php来响应，不做跳转。所以，研究了一下当前页面获取form表单提交的数据！

小唐同学.

2022/03/07

2.9K0

JQuery获取form表单数据及数据提交

jquery form 表单对象数据

未经允许不得转载：w3h5-Web前端开发资源网 » JQuery获取form表单数据及数据提交

德顺

2023/08/25

4550

C#网络爬虫实例：使用RestSharp获取Reddit首页的JSON数据并解析

python 网络爬虫

Reddit 是一个非常受欢迎的分享社交新闻聚合网站，用户可以在上面发布和内容。我们的目标是抓取 Reddit 首页的数据 JSON，以便进一步分析和使用。

小白学大数据

2023/10/16

4600

如何从Facebook获取流量？

译者：Nic 审校：陈明艳本文长度为4634字，预估阅读时间10分钟。前言：作为重要的流量来源的Facebook，流量中究竟蕴藏了什么秘密，让我们一探究竟！ Facebook带来数量相当可观

iCDO互联网数据官

2018/03/05

5.2K0

如何从Facebook获取流量？

【爬虫】获取Github仓库提交纪录历史的脚本 python

本脚本为第一版开发；后续会进行扩展 #! python3 import requests import time, datetime import json from colorama import Fore,Back,Style,init from bs4 import BeautifulSoup process = 0 output = 0 def req(type,addr,data='',**args): if type == 'get': try:

Mirror王宇阳

2020/12/16

1.4K0

Python开发实战教程(8)-向网页提交获取数据

Python应用现在如火如荼，应用范围很广。因其效率高开发迅速的优势，快速进入编程语言排行榜前几名。本系列文章致力于可以全面系统的介绍Python语言开发知识和相关知识总结。希望大家能够快速入门并学习Python这门语言。

做全栈攻城狮

2018/12/20

8850

相似问题

获取Reddit提交的正文？

11

从reddit获取图像

10

如何使用API获取Reddit提交的评论？

15

Reddit提交API 500错误

10

如何从reddit获取随机帖子

120

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例