社区首页 >问答首页 >流爆梯度

问流爆梯度
EN

Stack Overflow用户

提问于 2018-12-19 01:32:55

回答 1查看 1.2K关注 0票数 2

我有一个CNN架构来输出一个对象周围的一个盒子的坐标：

然而，如果我在tf中实现它，即使在一个时代之后，损失也会变成nan。我尝试过梯度裁剪和批处理规范化，但两者都不起作用。我怀疑我的损失出了什么问题，下面是相应的代码：

...
output = tf.layers.dense(dense, 4, name="output")

# Loss
error = output-y
error_sq = tf.square(error)
loss = tf.reduce_mean(error_sq, axis=-1)

# Training operation
optimizer = tf.train.RMSPropOptimizer(learning_rate=0.001, momentum=0.9, decay=0.0, epsilon=1e-08)
training_op = optimizer.minimize(loss)

我用keras实现了相同的体系结构，它运行得很好：

...
model.add(Dense(4))

# Optimizer
optimizer = RMSprop(lr=0.001, rho=0.9, epsilon=1e-08, decay=0.0)

# Compile
model.compile(optimizer = optimizer , loss = "mean_squared_error", metrics=["mean_squared_error"])

我看不出这两者有什么不同。

注1:如果我删除axis=-1参数，也会得到nan的值，但是我包含了它，因为keras平均数是用相同的参数计算的。

注2:即使我在输入上只训练了一个密集的层，keras模型也会慢慢收敛，而tensorflow模型则不会。

conv-neural-network

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-08-06 07:21:07

捕获可能是因为行，error = output-y。因为output是每个类的逻辑或预测概率。

如果我们打印它，它将如下所示：

output/logits =  [[-4.55290842e+00  9.54713643e-01  2.04970908e+00 ...  1.06385863e+00
  -1.76558220e+00  5.84793314e-02]
 [ 1.42444344e+01 -3.09316659e+00  4.31246233e+00 ... -1.64039159e+00
  -4.75767326e+00  2.69032687e-01]
 [-3.66746974e+00 -1.05631983e+00  1.63249350e+00 ...  2.34054995e+00
  -2.86306214e+00 -1.29766455e-02]
 ...
 [ 1.92035064e-01  2.18118310e+00  1.05751991e+01 ... -3.32132912e+00
   2.23277748e-01 -4.14045334e+00]
 [-3.95318937e+00  7.54375601e+00  5.60657620e-01 ...  3.35071832e-02
   2.31437039e+00 -3.36187315e+00]
 [-4.37104368e+00  4.23799706e+00  1.20920219e+01 ... -1.18962801e+00
   2.23617482e+00 -3.06528354e+00]]

因此，步骤error = output-y、error_sq = tf.square(error)和loss = tf.reduce_mean(error_sq, axis=-1)可能会导致NaN。

下面的代码将解决您的问题：

l1 = tf.layers.dense(normed_train_data, 64, activation='relu')
l2 = tf.layers.dense(l1, 64, activation='relu')
l3 = tf.layers.dense(l2, 4, name="output")

mse = tf.losses.mean_squared_error(labels=y, logits=l3)

loss = tf.reduce_mean(mse, name="loss")

optimizer = tf.train.RMSPropOptimizer(learning_rate=0.001, momentum=0.9, decay=0.0, epsilon=1e-08)
training_op = optimizer.minimize(loss)

correct = tf.nn.in_top_k(logits, y, 1)
accuracy = tf.reduce_mean(tf.cast(correct, tf.float32))

票数 1

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/53848232

复制

相关文章

WebService_04_JS调用WebService

在之间的介绍中提到过，WebService的底层数据传输本质上就是一种特殊逇HTTP的POST请求。

Learning_斌

2019/09/05

1.9K0

动态调用WebService

http://linglong117.blog.163.com/blog/static/277145472009127514463/

跟着阿笨一起玩NET

2018/09/19

1.5K0

使用axis调用WebService，Java WebService调用工具类

https 网络安全

能使得运行在不同机器上的不同应用无须借助附加的、专门的第三方软件或硬件，就可相互交换数据或集成。依据 WebService 规范实施的应用之间，无论它们所使用的语言、平台或内部协议是什么，都可以相互交换数据。

全栈程序员站长

2022/11/02

1.6K0

python调用webservice接口_webservice应用实例

python 编程算法 xml https

最近在搞基于python的webservice项目，今天为把环境给配好，折腾了不少时间，还是把配的过程记录下来，以后备用：

全栈程序员站长

2022/11/08

2.5K0

cxf框架调用webservice_webservice json

apache xml spring 网站 ajax

Ant做为一种工具已经广泛被使用，并且历史悠久。使用ant的内置命令，可以编译java源文件(javac),运行java文件（java），给class文件打包(jar、war、ear), 也可以创建（mkdir）、删除（del）、拷贝（copy），甚至可以使用ant执行sql文件。由于ant是用xml语言写成的文件，并取默认名为build.xml文件。所以，今后大家应该在见到名为build.xml文件时知道这是一个ant的文件。

全栈程序员站长

2022/09/29

1.9K0

cxf框架调用webservice_webservice json

java调用WebService（一）

java webservice wsdl 服务接口

因工作需要和一个Sap相关系统以WebService的方式进行接口联调，之前仅听过这种技术，但并没有实操过，所以将本次开发相关的踩坑进行记录

matinal

2023/10/13

7510

WebService系列之HttpClient调用WebService接口

soapui 测试测试工具

测试工具下载soapui测试 http://ws.webxml.com.cn/WebServices/WeatherWS.asmx?wsdl package com.extra.credit.ut

SmileNicky

2021/03/17

4.8K0

WebService系列之HttpClient调用WebService接口

Flex 中调用 WebService

import mx.rpc.events.*; import mx.rpc.AbstractOperation; import mx.rpc.soap.WebService; import mx.rpc.*; import mx.controls.*; private function UserLogin(user:String,pass:String):void{ var ws:WebService = new WebService();

用户3135539

2018/09/12

6850

ABAP调用CIS webservice

abap webservice

FUNCTION ZMLSCP1_FR0008. *"----------------------------------------------------------------------*"*"本地接口： *" IMPORTING*" VALUE(I_EBELN) TYPE EBELN OPTIONAL*" VALUE(I_MATNR) TYPE MATNR OPTIONAL*" EXPORTING*" VALUE(O_STATU) TYPE CHAR1*"

matinal

2020/11/27

6830

JaxWsProxyFactoryBean调用WebService实例[通俗易懂]

java https 网站网络安全 php

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/162672.html原文链接：https://javaforall.cn

全栈程序员站长

2022/09/13

2.1K0

Python调用webservice接口

python webservice 接口

from suds.client import Client url = "http://218.90.174.179:50038/JmYfjzService/clientRegisterServi

py3study

2020/01/10

3.8K0

PHP调用Webservice实例[通俗易懂]

https 网站 http utf8 xml

NuSoap是PHP环境下的WebService编程工具，用于创建或调用WebService。它是一个开源软件，是完全采用PHP语言编写的、通过HTTP收发SOAP消息的一系列PHP类，由NuSphere Corporation(http://dietrich.ganx4.com/nusoap/ )开发。NuSOAP的一个优势是不需要扩展库的支持，这种特性使得NuSoap可以用于所有的PHP环境，不受服务器安全设置的影响。　　

全栈程序员站长

2022/09/13

2.6K0

ABAP调用外部WebService

有两种方式一种就是网上流传的下面转载内容 TCode:se80 选择 Package,输入我们自己的开发包，后回车右击开发包名称，选择菜出现创建向导窗口选择”Service Consume

matinal

2020/11/27

1.8K0

WebService入门初使用（二）调用WebService服务

java http xml jdk rpc

上一节记录完WebService的创建，鉴于篇幅所致，将调用部分单独拿到本节，所调用WebService服务基于上一章节内容。

WindCoder

2018/09/20

1.7K0

WebService入门初使用（二）调用WebService服务

java webservice asmx_WebService-asmx后缀接口调用[通俗易懂]

编程算法 java access actionscript xml

简述：.asmx是webservice服务程序的后缀名，ASP.NET 使用.asmx 文件来对Web Services的支持。.asmx 文件和.aspx文件一样都属于文本文件。它包含在.aspx文件之中，成为ASP.NET应用程序的一部分。

全栈程序员站长

2022/07/01

2.1K0

java开发webservice接口_webservice接口的开发和调用

网站编程算法 java http https

1、定义一个interface，使用@WebService注解标注接口，使用@WebMethod注解标注接口中定义的所有方法，如下所示：

全栈程序员站长

2022/09/13

3.2K0

java开发webservice接口_webservice接口的开发和调用

delphi调用webservice问题总结

node.js 编程算法 delphi 网站 http

1.把WSDL的URL地址放到了HTTPRIO的WSDLLocation参数中，然后选择service和port 2.最近一个项目用到了delphi调用C#写的web服务的功能。用了一天的时间找原因，终于测试通过了。这是一个通过web服务把一个照片上传到网站指定位置的方法。先测试了N次都不成功，通过跟踪发现delphi根本没传过来任何值，通过查资料发现VS2005 默认是用的 SoapDocumentProtocol而Delphi 是使用的 SoapRpcProtocol.这会造成所以客户端传过去的字

Vaccae

2019/07/24

2.4K0

java调用php的webService

网站 php java http xml

1.首先先下载php的webservice包：NuSOAP，自己到官网去下载，链接就不给出来了，自己去google吧

黄啊码

2020/05/29

1.8K0

Axis调用Webservice添加SoupHeader

http apache xml java html

Axis全称Apache eXtensible Interaction System，是apache组织下的一个开源项目，用来做webservice开发的，有java版的实现，也有c++版的实现，其前身最早是IBM的SOAP4J，后来捐给Apache后改名Apache SOAP，也就是支持SOAP1.1的那个版本，到现在的AXIS已经是第三代了，AXIS对Apache SOAP的改进有很多，比如用SAX代替以前的DOM，增加对WSDL的支持，支持SOAP1.2等等

JQ实验室

2023/01/12

1.2K0

点击加载更多

相似问题

多次调用webservice

22

宏Webservice Libre Office -多次调用

113

HandleAuthenticateAsync被多次调用

175

事件多次被调用。

14

LocationListener被多次调用

10

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例