开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >在训练pytorch RNN时损失不会减少

问在训练pytorch RNN时损失不会减少
EN

Stack Overflow用户

提问于 2018-04-01 18:25:45

回答 2查看 1.7K关注 0票数 1

这是我为一种情感而设计的RNN网络。

class rnn(nn.Module):
    def __init__(self, input_size, hidden_size, output_size):
        super().__init__()
        self.hidden_size = hidden_size
        self.i2h = nn.Linear(input_size, hidden_size)
        self.h2o = nn.Linear(hidden_size, output_size)
        self.h2h = nn.Linear(hidden_size , hidden_size)
        self.relu = nn.Tanh()
        self.sigmoid = nn.LogSigmoid()

    def forward(self, input, hidden):
        hidden_new = self.relu(self.i2h(input)+self.h2h(hidden))
        output = self.h2o(hidden)
        output = self.sigmoid(output)
        return output, hidden_new

    def init_hidden(self):
        return Variable(torch.zeros(1, self.hidden_size))

然后，创建并训练网络，如下所示：

RNN = rnn(50, 50, 1)
learning_rate = 0.0005
criteria = nn.MSELoss()
optimizer = optim.Adam(RNN.parameters(), lr=learning_rate)
hidden = RNN.init_hidden()
epochs = 2
for epoch in range(epochs):
    for i in range(len(train['Phrase'])):
        input = convert_to_vectors(train['Phrase'][i])
        for j in range(len(input)):
            temp_input = Variable(torch.FloatTensor(input[j]))
            output, hidden = RNN(temp_input, hidden)
        temp_output = torch.FloatTensor([np.float64(train['Sentiment'][i])/4])
        loss = criteria( output, Variable(temp_output))
        loss.backward(retain_graph = True)
        if (i%20 == 0):
            print('Current loss is ', loss)

问题是网络的损失并没有减少。它增加，然后减少，以此类推。它一点也不稳定。我试着使用较小的学习率，但似乎没有帮助。

为什么会发生这种情况，我该如何纠正这种情况？

machine-learning

EN

回答 2

Stack Overflow用户

发布于 2018-06-25 11:03:32

您只需要在执行loss.backward()之后调用optimizer.step()。

顺便说一句，这说明了一个常见的误解：反向传播不是一种学习算法，它只是计算损失的梯度的一种很酷的方式。你的参数。然后使用梯度下降的一些变体(例如，简单的SGD，AdaGrad等，在你的例子中是Adam)来更新给定的梯度的权重。

票数 1

EN

Stack Overflow用户

发布于 2018-04-02 08:11:16

我想有些东西可能会对你有所帮助。首先，在rnn类模块中，最好用"super(rnn,self).__init__()"代替"super().__init__()"。

第二，变量名要和函数一致，最好用"self.tanh = nn.Tanh()"代替"self.relu = nn.Tanh()"。在rnn中，sigmoid函数应该是1/(1+exp(-x))，而不是logsigmoid函数。您应该使用"self.sigmoid = nn.Sigmoid()"来取代"self.sigmoid = nn.LogSigmoid()"。第三，如果您使用rnn进行分类，则应通过softmax函数激活输出。因此，您应该添加两个语句："self.softmax = nn.Softmax()"和"output = self.softmax(output)"。

票数 0

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/49601263

复制

相关文章

cmake:在Makefile中运行ant脚本

打包 apache makefile c++https

版权声明：本文为博主原创文章，转载请注明源地址。 https://blog.csdn.net/10km/article/details/51832822

10km

2019/05/25

1.8K0

【Apache Ant】ANT解析以及ANT在myEclipse中的使用

apache jar linux

Apache Ant，是一个将软件编译、测试、部署等步骤联系在一起加以自动化的一个工具，大多用于Java环境中的软件开发。

谙忆

2021/01/21

1.5K0

【Apache Ant】ANT解析以及ANT在myEclipse中的使用

在HTML中如何使用CSS？

一、前言在 HTML 中使用 CSS，包括内联式、内嵌式、链接式和导入式。二、分类 2.1 内联式内联式是所有样式应用方式中最为直接的一种，它通过对 HTML 标记使用属性，将 CSS 代码直接写在其中。内联式是最简单、直接的 CSS 使用方法，但它的针对性很明显，只能作用于当前标记，造成代码冗余，维护比较困难。 2.2 内嵌式内嵌式与内联式使用方法不同，它将 CSS 代码写在标记之间，并需要采用标记进行声明。使用内嵌式 CSS 用法时 CSS 代码将被集中放在标记中，这样方便查

企鹅号小编

2018/02/01

8.7K0

Ant 执行 YUICompressor

java apache javascript css http

发布 JavaScript 的时候，无论从代码保护还是提高性能角度，都应该对代码进行压缩，去除重叠的空白分隔符，混淆变量。雅虎交互（YUI）提供了非常强大的压缩工具，对 .js 文件和 .css 文件都有效。这里所说明的情况，是用 Ant 直接启动压缩任务。

全栈程序员站长

2022/09/09

3540

【shell脚本】$ 在shell脚本中的使用

注释：$* 和 $@ 都表示传递给函数或脚本的所有参数，不被双引号(" ")包含时，都以"$1" "$2" … "$n" 的形式输出所有参数。但是当它们被双引号(" ")包含时，"$*" 会将所有的参数作为一个整体，以"$1 $2 … $n"的形式输出所有参数；"$@" 会将各个参数分开，以"$1" "$2" … "$n" 的形式输出所有参数

码缘

2019/07/01

6.3K0

JSON 在JavaScript 中的使用。

json javascript java 编程算法

JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。

愷龍

2022/10/06

10.1K0

Ant中的SVN 使用

最近在调整SDK的打包脚本的时候重新树立了一下ant下面的SVN命令的用法。先简单列举下，以后有精力再慢慢整理细说吧。 svn copy 多用于生成当前版本的tag <arg line="copy SVN_URL1 SVN_URL2 --no-auth-cache --non-interactive --username USERNAME --password PASSWORD -m MSG" /> </exec> svn add 多用于提交在版本打包过程生成的重要文件，例如代码混淆生成的mapp

子勰

2018/05/22

9010

YUI3 CSS框架学习

改变最大的我觉得是Grids部分，YUI2中以模版的方式提供给我们调用，功能中多选项也很多，而且配合Grid Build Tool，可以快速的生成复杂的页面结构。但正因为其复杂，所以在一些需要自定义比较多的场景下使用起来就比较痛苦。YUI3一改以往的复杂性，仅仅是提供简单的页面逻辑结构单元，我们可以自由的定义页面的宽度，结构单元的分布。非常简单。当然，目前还处于Beta阶段，不知道后续会不会变的越来越强大。

大江小浪

2018/07/25

6630

ant的安装和使用

xml apache 编程算法 https 网络安全

　　1.1 添加环境变量：ANT_HOME=D:\software\ant\apache-ant-1.10.1

全栈程序员站长

2022/09/07

5050

Ant+JSDocTookit生成Javascript文档

需要备上下面三样东西 JSDocTookit http://code.google.com/p/jsdoc-toolkit/

meteoric

2018/11/15

8870

ant+yuicompressor 合并、压缩脚本与样式

我使用的是Eclipse编写build.xml，你可以用其它的编辑器，前提是你已经安装了ant

meteoric

2018/11/15

8680

如何使用LinkFinder在JavaScript文件中查找网络节点

javascript 正则表达式工具开发网络

LinkFinder是一款功能强大的Python脚本，在该工具的帮助下，广大研究人员可以轻松在JavaScript文件中发现和扫描网络节点及其相关参数。这样一来，渗透测试人员和漏洞猎人将能够快速在测试的目标网站伤收集新的隐藏节点了。

FB客服

2023/08/08

5280

如何使用LinkFinder在JavaScript文件中查找网络节点

java: ant 脚本示例

1 <?xml version="1.0" encoding="UTF-8"?> 2 3  4 <project nam

菩提树下的杨过

2018/01/24

8700

在 JavaScript 中如何克隆对象？

json https javascript 网络安全编程算法

我们假设一个变量 name 具有一个与之关联的原始值（number，string，boolean，undefined 和null）。如果我们将此变量 name 复制到另一个变量name2 ，则原始变量的任何修改都不会影响到第二个变量，因为它们是原始值。

前端小智@大迁世界

2022/06/15

4.7K0

分享 73 个让你事半功倍的 NPM 包

网络安全 https node.js webpack 打包

英文 | https://dev.to/madza/73-awesome-npm-packages-for-productivity-19p8

前端达人

2022/03/25

5.4K0

如何开发YUI3的扩展

jquery javascript

YUI是Yahoo发布的一个JS框架，虽然不如jQuery简单，但是如果你是要做一些复杂的事情的时候，有一个合适量级的框架还是能有用不少。

大江小浪

2018/07/25

1.2K0

73个超棒且可提高生产力的 NPM 包

node.js javascript react api 网站

在这里，我整理了一些我最喜欢的 NPM 包的列表。我也将它们分类，因此信息更加结构化，更易于浏览。

ConardLi

2020/11/10

4.6K0

73个超棒且可提高生产力的 NPM 包

Webpack4 性能优化实践

webpack react vue.js

在使用 Webpack 时，如果不注意性能优化，可能会产生性能问题，会导致在开发体验上不是非常丝滑，性能问题主要是编译速度慢，打包体积过大，因此性能优化也主要从这些方面来分析。本文主要是自己平时的工作积累和参考别人的文章，而进行总结，基于 Webpack4 版本。

发声的沉默者

2021/06/14

1.2K0

Webpack4 性能优化实践

点击加载更多

相似问题

如何在用于javascript的Ant构建脚本中使用YUI压缩器

20

无法使用Ant和YUI压缩器应用JavaScript压缩

37

yui压缩器是如何压缩javascript和css文件的呢？

31

关于YUI压缩器和About脚本

14

YUI压缩器在构建时压缩和更换

20

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例