文章/答案/技术大牛

发布

社区首页 >问答首页 >基本多层感知器的参数优化问题

问基本多层感知器的参数优化问题
EN

Stack Overflow用户

提问于 2019-03-31 23:34:41

回答 1查看 293关注 0票数 1

我最近刚进入Tensorflow，但从简单的单层神经网络扩展到多层神经网络时遇到了一些问题。我已经从我的尝试中粘贴了下面的代码，任何关于它为什么不工作的帮助都将不胜感激！

import tensorflow as tf
from tqdm import trange
from tensorflow.examples.tutorials.mnist import input_data

# Import data
mnist = input_data.read_data_sets("datasets/MNIST_data/", one_hot=True)

x = tf.placeholder(tf.float32, [None, 784])
W0 = tf.Variable(tf.zeros([784, 500]))
b0 = tf.Variable(tf.zeros([500]))
y0 = tf.matmul(x, W0) + b0
relu0 = tf.nn.relu(y0)
W1 = tf.Variable(tf.zeros([500, 100]))
b1= tf.Variable(tf.zeros([100]))
y1 = tf.matmul(relu0, W1) + b1
relu1 = tf.nn.relu(y1)
W2 = tf.Variable(tf.zeros([100, 10]))
b2= tf.Variable(tf.zeros([10]))
y2 = tf.matmul(relu1, W2) + b2
y = y2


# Define loss and optimizer
y_ = tf.placeholder(tf.float32, [None, 10])
cross_entropy =       tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y_, logits=y))
train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

# Create a Session object, initialize all variables
sess = tf.Session()
sess.run(tf.global_variables_initializer())
# Train
for _ in trange(1000):
    batch_xs, batch_ys = mnist.train.next_batch(100)    
    sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})

# Test trained model
correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
print('Test accuracy: {0}'.format(sess.run(accuracy, feed_dict={x: 
mnist.test.images, y_: mnist.test.labels})))

sess.close()

PS:我知道使用Keras甚至是预建的Tensorflow层可以更容易地实现这段代码，但我正在尝试对库背后的数学有一个更基本的理解。谢谢!

python

tensorflow

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-04-01 00:02:07

你有两件事要考虑。

1) tf.Variable(tf.zeros([784, 500]))使用tf.Variable(tf.random_normal([784, 500]))更改这一点，因为随机初始化权重比从一开始就将它们定义为0更好。通过最初将其设置为0(意味着所有内容都具有相同的值)，模型将遵循相同的梯度路径，并且将无法学习。首先，使用random_normal更改每个zeros。首先定义变量有更好的方法，但这会给你一个好的开始

2)您的学习率太高train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)将此行更改为

train_step = tf.train.GradientDescentOptimizer(0.005).minimize(cross_entropy)

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/55446412

复制

使用Python和IBM Watson可视化的个性简介

https 网络安全 python github

伟大的社会心理学家James Pennebaker曾经说过：“通过更仔细地观察人们用语言表达思想的方式，可以开始了解他们的个性，情感和与他人的关系。”他和许多其他心理学家，语言学家一起，自然语言处理（NLP）从业者在使用双向LSTM和NLU（自然语言理解）等高级技术从书面文本中推断出详细（和极其准确）的个性信息方面取得了很大进展。

代码医生工作室

2019/09/08

1.3K0

Oracle 无效对象查询，编译无效对象

打包

查看当前无效对象 select * from dba_objects t where t.status = 'INVALID' order by 1; 编译无效对象：有两种方式： 1、执行sql查询结果： select 'alter '||object_type||' '||owner||'.'||object_name||' compile;' from dba_objects t where t.status = 'INVALID' order by 1; 2、脚本编译： sqlplu

Lucifer三思而后行

2021/09/22

3K0

api-key搭配fofa_viewer的使用教程

java https 网络安全

Fofa_Viewer是一个简单易用的fofa客户端，由 WgpSec狼组安全团队 f1ashine 师傅主要开发。程序使用 JavaFX 编写，便于跨平台使用，相比与web端的方式查询，其启动与搜索速度都有比较明显的提升！接下来介绍一下如何使用吧！

Tommonkey

2023/02/14

2.8K0

checkout无效

checkout commit

前景日常工作中，遇到的一些checkout无效或者commit提交不了的情况 1.首先你需要update的项目会告诉你更改了那些配置，必须要还原或者提交 git pull 2.暂存提交 git stash 命令的意思是将这些更改过的配置暂存起来，注意是暂存 3.更新 git pull #拉取最新代码 4.取暂存 git statsh pop 5.检查是否可以checkout或者commit 最后你发现之前暂存的配置，以及取出来并且成功替换了update之后的配置

cywhat

2022/11/22

2.3K0

【程序源代码】ChatGPT 智能QQ机器人

机器人 python api

“ 关键字: “ChatGPT AI 人工智能" 01 ———— 【总体介绍】智能的QQ机器人过调用OpenAI GPT-3模型提供的Completion API来实现一个更加智能的QQ机器人功能列表 ✅回复符合上下文 ✅支持敏感词过滤，避免账号风险✅群内多种响应规则，不必at✅使用官方api，不需要网络代理，稳定快捷✅完善的多api-key管理，超额自动切换✅组件少，部署方便，提供一键安装器及Docker安装✅支持预设指令文字✅完善的会话管理，重启不丢失✅支持对话、绘图等模型，可玩性更高✅

程序源代码

2023/03/09

9.6K0

不作恶！IBM宣布放弃人脸识别业务，关停技术研发

人脸识别云计算混合云解决方案

当地时间6月8日，IBM高调宣布不再提供任何人脸识别服务和人脸分析软件，正式退出这一市场。不仅如此，今后IBM也不会继续研发相关技术。

量子位

2020/06/16

4860

websocket注入无效

网络安全

@Autowired等注入无效解决方法：在需要使用你想注入的service的地方用如下方式引用： GameRecordService gameRecordService = applicationContext.getBean(GameRecordService.class);

似水的流年

2019/12/05

2.2K0

伦理与技术之争，IBM首个站出来直言“放弃”人脸识别

人脸识别编程算法

IBM CEO Arvind Krishna在日前递交给美国国会议员的一封信中提到了这个决定，并表示“IBM反对使用任何技术（包括其他供应商提供的人脸识别技术）来监视大众、种族定性、侵犯基本人权和自由，以及用于任何与我们价值观及原则不一致的目的。”

镁客网

2020/06/16

3800

开源 | IBM、哈佛共同研发：Seq2Seq模型可视化工具

机器翻译

近年来随着深度学习和神经网络技术的发展，机器翻译也取得了长足的进步。神经网络结构越来越复杂，但我们始终无法解释内部发生了什么，“黑箱问题”一直困扰着我们。我们不清楚程序在翻译过程中如何进行决策，所以当翻译出错时也很难改正。随着深度学习在各行各业中的广泛应用，深度学习的不可解释性已经成为其面临的严峻挑战之一。

AI科技大本营

2018/12/21

5150

业界 | IBM 语音识别新方向：仿生蝙蝠耳能用声纳精准“聆听”

语音识别数据库 sql

蝙蝠使用生物声呐，为夜晚在丛林中飞行导航。他们的超声波脉冲，可以比人造声呐装置更精确地对声音进行定位。为复制、驾驭这种能力，IBM 学院奖获得者 Rolf Müller 教授协同他在弗吉尼亚理工学院（Virginia Tech）的团队，设计了一种人造蝙蝠耳。 Rolf Müller 的研究引起了 IBM 的注意。IBM 专家韩金萍（音译）的神经计算团队，和 IBM Watson 语音专家崔晓东（音译）和他的同事，看到了 Müller 教授人造“动态外耳”（dynamic peripheral，蝙蝠可转

AI科技评论

2018/03/09

1.2K0

图像识别的可视化解释史

图像识别编程算法访问管理机器学习深度学习

使用机器学习（ML）算法（尤其是现代深度学习）进行图像识别的最大挑战之一，是难以理解为什么一个特定的输入图像会产生它所预测的结果。

小白学视觉

2022/12/27

3020

图像识别的可视化解释史

图像识别机器学习人工智能编程算法神经网络

使用机器学习（ML）算法（尤其是现代深度学习）进行图像识别的最大挑战之一，是难以理解为什么一个特定的输入图像会产生它所预测的结果。

新智元

2020/12/11

6570

mysql explain 无效[通俗易懂]

https 网络安全 sql

最近分析一段sql 是不是命中索引的，发现有的时候 explain 是可以的，有的时候又不行

全栈程序员站长

2022/11/02

2K0

TRTC setAudioRoute无效问题

实时音视频

TRTC双方音视频通话时，不开麦的一方，通过setAudioRoute设置是否声音外放是没有效果的原因：不开麦时走的是媒体通道，无法设置声音外放setAudioRoute。分析： [I][2020-09-15 +8.0 18:21:45.097][28356, 30490][][audio_device_android.cpp, OnPlayAudioData, 1533][AudioEngine : AudioDeviceAndroid play device ready:sample_rate:48000 channels:2 bits:16, volumetype:MEDIA_PLAY：表示现在使用的是媒体通道，没有办法设置是否外放只有当volumetype不为MEDIA_PLAY，为volumetype:VOIP才能正常设置外放还是听筒。

Sumn

2022/01/18

2K0

dropna无效_drop from

java https 网络安全

全栈程序员站长

2022/09/29

1.3K0

Google在英国推出带面部识别的可视门铃

其他

Google的面部识别视频门铃Nest Hello在英国推出，挑战亚马逊的Ring。

AiTechYun

2018/07/27

6990

ListView setOnItemClickListen 方法无效

其他

在listview中item里如果有checkbox,imagebutton等控件,焦点会被子这些子控件捕获到，ListView无法捕获处理事件.可以用下面的方法解决可以再item的根布局设置如下属性:

夏洛克的猫

2018/10/18

9420

FragmentPagerAdapter刷新notifyDataSetChanged无效

https java android 网络安全

复写pageradapter的getItemPosition方法设置tag为POSITION_NONE意思是没有找到child要求重新加载。

全栈程序员站长

2022/09/07

1.3K0

PermitRootLogin yes无效问题

ssh https java 网络安全

/etc/ssh/sshd_config明明设置了PermitRootLogin 为yes，可就是用putty连，root登录不了，每次都access denied。

全栈程序员站长

2022/07/01

2.7K0

ora00904::标识符无效_ora-00911 无效字符

sql https 网络安全

ORA：即Oracle报错。标识符无效：SQL语句中，这个字段名不在表中。解决方案：修改SQL语句中对应的字段或者修改表里面对应的列名。

全栈程序员站长

2022/11/01

1.4K0

相似问题

React本地映像加载缓慢

React Native -在映像中加载本地映像

react:未能从本地api路径加载映像

React不会使用道具加载本地映像

React.js项目本地映像突然停止加载

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问基本多层感知器的参数优化问题
EN