开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >为什么我不能提高CNN在时尚MNIST数据集上的性能？

问为什么我不能提高CNN在时尚MNIST数据集上的性能？
EN

Stack Overflow用户

提问于 2019-03-20 18:42:32

回答 2查看 426关注 0票数 0

我正在使用Pytorch，我在MNIST数据集上实现了一个CNN，它在训练和测试集上都具有99+%准确性。

我决定切换到时尚MNIST，以了解我的网络架构是如何执行的。我在训练集上获得了95%的准确率，在测试集上获得了91%的准确率。

然后，我开始尝试通过调整模型来提高性能。

简而言之，我的模型看起来像这样：

         Conv -> ReLU -> Batch norm -> Max pool ->
         Conv -> ReLU -> Batch norm -> Max pool ->
         Conv -> ReLU -> Batch norm -> Max pool ->
         Conv -> ReLU -> Batch norm -> Max pool ->
         Linear -> ReLu -> Linear -> Output

         Optimizer: Stochastic Gradient Descent
         Transformations: ToTensor() only

我的测试包括删除最后一个Conv层，在最后一个Conv层中添加平均池化而不是最大池化，检查训练损失曲线，以便静态或动态地调整学习率并改变批量大小。

然而，使用上面的组合，我的模型将会过拟合(例如，97%的训练，89%的测试)，否则它不会有最好的性能(例如91%的训练，89%的测试)。

我是不是遗漏了什么？我做错了什么吗？有没有其他我没想到需要调整的调优参数？

谢谢

computer-vision

conv-neural-network

EN

回答 2

Stack Overflow用户

发布于 2019-03-20 18:55:44

你是否在你的神经网络上实现了Dropout。丢弃有助于将神经元的权重随机设置为零，因此特定时间的神经元不会相加为误差，.And避免了过度拟合。

票数 0

EN

Stack Overflow用户

发布于 2019-03-21 17:59:47

时尚MNIST是一个比MNIST更难的问题。因此，您的架构表现不佳也就不足为奇了。

如果您希望获得更高的精度，您可能需要尝试this paper中描述的方法。

票数 0

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/55268035

复制

相关文章

[Keras深度学习浅尝]实战二·CNN实现Fashion MNIST 数据集分类

keras 深度学习机器学习神经网络人工智能

与我们上篇博文[Keras深度学习浅尝]实战一结构相同，修改的地方有，定义网络与模型训练两部分，可以对比着来看。通过使用CNN结构，预测准确率略有提升，可以通过修改超参数以获得更优结果。代码部分

小宋是呢

2019/06/27

1.2K0

基于Keras+CNN的MNIST数据集手写数字分类

Keras官方github链接：https://github.com/keras-team/keras 官方的口号是Keras: Deep Learning for humans，中文叫做Keras是给人使用的深度学习开发框架，其意义是Keras是一个高度集成的开发框架，其中的API调用很简单。 Keras用python语言编写，在tensorflow、cntk、theano这3种框架的基础上运行。本文是学习github源码的笔记，源码链接：https://github.com/keras-team/keras/blob/master/examples/cifar10_cnn.py

潇洒坤

2018/10/09

2.4K0

基于Keras+CNN的MNIST数据集手写数字分类

在MNIST数据集上使用Pytorch中的Autoencoder进行维度操作

编程算法文件存储

现在根据深度学习书，自动编码器是一种神经网络，经过训练旨在将其输入复制到其输出。在内部，它有一个隐藏层，用于描述用于表示输入的代码。网络可被视为由两部分组成：编码器功能“h = f（x）”和产生重建“r = g（h）”的解码器。

代码医生工作室

2019/09/10

3.6K0

在MNIST数据集上使用Pytorch中的Autoencoder进行维度操作

教程 | 使用MNIST数据集，在TensorFlow上实现基础LSTM网络

选自GitHub 机器之心编译参与：刘晓坤、路雪本文介绍了如何在 TensorFlow 上实现基础 LSTM 网络的详细过程。作者选用了 MNIST 数据集，本文详细介绍了实现过程。长短期记忆（LSTM）是目前循环神经网络最普遍使用的类型，在处理时间序列数据时使用最为频繁。关于 LSTM 的更加深刻的洞察可以看看这篇优秀的博客：http://colah.github.io/posts/2015-08-Understanding-LSTMs/。我们的目的这篇博客的主要目的就是使读者熟悉在 Tenso

机器之心

2018/05/08

1.5K0

教程 | 使用MNIST数据集，在TensorFlow上实现基础LSTM网络

基于tensorflow+CNN的MNIST数据集手写数字分类预测

tensorflow go 深度学习卷积神经网络 nat

tensorflow是谷歌google的深度学习框架，tensor中文叫做张量，flow叫做流。 CNN是convolutional neural network的简称，中文叫做卷积神经网络。 MNIST是Mixed National Institue of Standards and Technology database的简称，中文叫做美国国家标准与技术研究所数据库。此文在上一篇文章《基于tensorflow+DNN的MNIST数据集手写数字分类预测》的基础上修改模型为卷积神经网络模型，模型准确率从98%提升到99.2% 《基于tensorflow+DNN的MNIST数据集手写数字分类预测》文章链接：https://www.jianshu.com/p/9a4ae5655ca6

潇洒坤

2018/10/09

2K4

基于tensorflow+CNN的MNIST数据集手写数字分类预测

使用CNN卷积神经网络模型训练mnist数据集

机器学习神经网络深度学习人工智能 html5

卷积操作就是卷积核（kernal）跟输入数据每个值相乘再加起来得到的一个值作为输出

yichen

2021/03/10

1.1K0

torch05：CNN--MNIST识别和自己数据集

https 网络安全机器学习神经网络深度学习

（2）定义训练数据，加餐部分是使用自己的数据集：（可参考：https://blog.csdn.net/u014365862/article/details/80506147）

MachineLP

2019/05/26

8900

详解 MNIST 数据集

numpy 文件存储编程算法

MNIST 数据集已经是一个被”嚼烂”了的数据集, 很多教程都会对它”下手”, 几乎成为一个 “典范”. 不过有些人可能对它还不是很了解, 下面来介绍一下.

全栈程序员站长

2022/07/22

2.5K0

[941]mnist数据集问题

http https 网络安全

The code attempts to download the data files from the MNIST web site, and assumes it’s properly downloaded if the file is present locally on your system. You might have a corrupted file, in which case deleting it and retrying might help. Otherwise, try to get the data via your browser directly from:

周小董

2021/02/04

6490

MNIST手写数据集

2023腾讯·技术创作特训营第二期

MNIST是一个非常经典的手写数字数据集，由美国国家标准与技术研究所（NIST）在20世纪80年代整理和标注。这个数据集包含了一系列0到9的手写数字图像，用于机器学习中的图像分类任务。MNIST数据集被广泛应用于训练和验证机器学习模型的性能。

大盘鸡拌面

2023/10/22

8100

Imagenet数据集_mnist数据集介绍

神经网络机器学习人工智能 https 深度学习

数据集下载地址：http://www.image-net.org/challenges/LSVRC/

全栈程序员站长

2022/09/27

1K0

Imagenet数据集_mnist数据集介绍

详解 MNIST 数据集

MNIST 数据集已经是一个被"嚼烂"了的数据集, 很多教程都会对它"下手", 几乎成为一个 "典范". 不过有些人可能对它还不是很了解, 下面来介绍一下.

用户1558438

2018/08/23

2.4K0

MNIST数据集的格式转换

tensorflow 图像处理机器学习

本文介绍了MNIST数据集格式的转换，包括将原始数据转换为二进制格式、将图像和标签分离、将标签转换为独热编码等步骤。作者还提供了一个基于Python的fetch\_mnist工具，可以方便地读取和转换MNIST数据集。该工具在测试集上的表现良好，可以快速地处理大规模的MNIST数据集，为深度学习模型的训练和测试提供有力的支持。

锦小年

2018/01/02

2.3K0

MNIST数据集 & CIFAR10数据集

java https python html 网络安全

飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船、卡车下载后文件夹内部是这样

全栈程序员站长

2022/09/10

6880

MNIST数据集 & CIFAR10数据集

使用 PyTorch 实现 MLP 并在 MNIST 数据集上验证

pytorch 腾讯云测试服务神经网络 java https

这是深度学习课程的第一个实验，主要目的就是熟悉 Pytorch 框架。MLP 是多层感知器，我这次实现的是四层感知器，代码和思路参考了网上的很多文章。个人认为，感知器的代码大同小异，尤其是用 Pytorch 实现，除了层数和参数外，代码都很相似。

全栈程序员站长

2022/06/28

2K0

Python读取mnist数据集

在看deeplearning教程的时候遇到了这么个玩意，mnist，一个手写数字的数据集。大概是google为了方便广大程序员进行数字识别而构建的库，里面都是美国中学生手写的阿拉伯数字，但是为了方便存储，他并不是以图片的形式保存的，而是以二进制文件的形式保存的。这就让普通人看着略微蛋疼的了，教程里也并没有提供具体的提取图片的方案。得，读取这个还得自己来。

mythsman

2022/11/14

6770

Python读取mnist数据集

MNIST数据集 — 前期准备

tensorflow 编程算法

前面都是基础零碎的知识，需要通过一个栗子来为大家把整个流程走一遍，从整体上对TensorFlow进行一个把握，大概分为四篇文章来说明吧(前期准备、前馈计算、模型训练、模型评价)。

木野归郎

2020/10/30

5150

MNIST数据集 — 前期准备

取代MNIST？德国时尚圈的科学家们推出基准数据集，全是衣裤鞋包

机器学习人工智能

李林编译整理量子位报道 | 公众号 QbitAI MNIST，是一个手写数字数据集，除了用在机器学习入门的教学中，它还是对机器学习算法进行基准测试的常用数据集。但是，总有人觉得MNIST不够好

量子位

2018/03/27

9060

取代MNIST？德国时尚圈的科学家们推出基准数据集，全是衣裤鞋包

在自己的数据集上训练TensorFlow更快的R-CNN对象检测模型

https 网络安全机器学习神经网络深度学习

计算机视觉正在彻底改变医学成像。算法正在帮助医生识别可能错过的十分之一的癌症患者。甚至有早期迹象表明胸部扫描可有助于COVID-19的识别，这可能有助于确定哪些患者需要进行实验室检查。

代码医生工作室

2020/03/18

3.7K0

在自己的数据集上训练TensorFlow更快的R-CNN对象检测模型

点击加载更多

相似问题

为什么数据增强不能提高我的性能(cnn)？

12

时尚MNIST使用CNN，超身？

11

不加载MNIST时尚数据集

213

在MNIST数据集上训练CNN的数字识别性能差

24

使用keras加载mnist时尚数据集

217

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例