开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Tensorflow官方MNIST模型训练精度高但预测性能低

TensorFlow是一个开源的机器学习框架，它提供了丰富的工具和库，用于构建和训练各种机器学习模型。MNIST是一个经典的手写数字识别数据集，被广泛用于机器学习的入门教学和性能评估。

对于TensorFlow官方MNIST模型，训练精度高但预测性能低可能有以下几个原因：

模型复杂度：官方MNIST模型可能是一个相对复杂的模型，它在训练数据上能够达到很高的精度，但在预测时可能需要更多的计算资源和时间。这可能是因为模型的参数量较大，导致预测时的计算量较大。
过拟合：过拟合是指模型在训练数据上表现很好，但在新数据上表现较差。如果模型在训练过程中过度拟合了训练数据，它可能会在预测时表现较差。为了解决过拟合问题，可以尝试使用正则化技术、增加训练数据量、减少模型复杂度等方法。
数据不平衡：MNIST数据集中的手写数字可能存在类别不平衡的情况，即某些数字的样本数量较少。如果模型在训练过程中没有充分学习到这些少数类别的特征，它在预测时可能会出现性能低下的情况。可以尝试使用数据增强技术、调整类别权重等方法来解决数据不平衡问题。

针对这个问题，腾讯云提供了一系列与机器学习和深度学习相关的产品和服务，可以帮助提高模型的预测性能。以下是一些推荐的腾讯云产品和产品介绍链接：

腾讯云AI Lab：提供了丰富的机器学习和深度学习工具、算法和模型，可以帮助开发者快速构建和训练模型。详情请参考：腾讯云AI Lab
腾讯云机器学习平台（Tencent Machine Learning Platform，TMLP）：提供了完整的机器学习生命周期管理工具，包括数据准备、模型训练、模型部署和模型监控等功能。详情请参考：腾讯云机器学习平台
腾讯云GPU服务器：提供了高性能的GPU服务器实例，可以加速深度学习模型的训练和推理过程。详情请参考：腾讯云GPU服务器
腾讯云弹性AI推理（Tencent Elastic AI Inference，TEAI）：提供了高性能的AI推理服务，可以加速深度学习模型的预测过程。详情请参考：腾讯云弹性AI推理

需要注意的是，以上推荐的产品和服务仅供参考，具体的选择应根据实际需求和情况进行。同时，为了提高预测性能，还可以尝试调整模型的超参数、优化模型结构、使用更高级的优化算法等方法。

相关搜索:11.11建筑综合运营管理系统有优惠吗 11.11建筑能源设备智能管理有优惠吗 11.11农村数字化综合服务平台有优惠吗 11.11智能呼叫机器人有优惠吗 11.11智能语音对话机器人有优惠吗 11.11智能语音通知机器人有优惠吗 11.11智能语音电话机器人有优惠吗 11.11智能联络机器人有优惠吗 11.11企业出行服务系统有优惠吗 11.11企业用车服务系统有优惠吗

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

深度学习算法优化系列十七 | TensorRT介绍，安装及如何使用？

由于前期OpenVINO的分享已经基本做完了，笔者也可以成功的在CPU和Intel神经棒上完整的部署一些工作了，因此开始来学习TensorRT啦。先声明一下我使用的TensorRT版本是TensorRT-6.0.1.5 。

04

【深度域自适应】二、利用DANN实现MNIST和MNIST-M数据集迁移训练

在前一篇文章【深度域自适应】一、DANN与梯度反转层（GRL）详解中，我们主要讲解了DANN的网络架构与梯度反转层（GRL）的基本原理，接下来这篇文章中我们将主要复现DANN论文Unsupervised Domain Adaptation by Backpropagation中MNIST和MNIST-M数据集的迁移训练实验。

01

谷歌发布分类模型EfficientNet-EdgeTPU，运行速度比ResNet-50快10倍

谷歌在3月份推出了Coral Dev Board，采用张量处理器（Edge TPU）AI加速器芯片，以及一个USB加密狗，旨在加速现有Raspberry Pi和Linux系统的机器学习推理。

01

Android+TensorFlow+CNN+MNIST实现手写数字识别

训练和评估部分主要目的是生成用于测试用的pb文件，其保存了利用TensorFlow python API构建训练后的网络拓扑结构和参数信息，实现方式有很多种，除了cnn外还可以使用rnn，fcnn等。其中基于cnn的函数也有两套，分别为tf.layers.conv2d和tf.nn.conv2d， tf.layers.conv2d使用tf.nn.conv2d作为后端处理，参数上filters是整数，filter是4维张量。原型如下：

04

（数据科学学习手札36）tensorflow实现MLP

我们在前面的数据科学学习手札34中也介绍过，作为最典型的神经网络，多层感知机（MLP）结构简单且规则，并且在隐层设计的足够完善时，可以拟合任意连续函数，而除了利用前面介绍的sklearn.neural_network中的MLP来实现多层感知机之外，利用tensorflow来实现MLP更加形象，使得使用者对要搭建的神经网络的结构有一个更加清醒的认识，本文就将对tensorflow搭建MLP模型的方法进行一个简单的介绍，并实现MNIST数据集的分类任务；

04

EfficientNet-lite详解：当前最强移动端轻量神经网络

3.17日谷歌在 GitHub 与 TFHub 上同步发布了 EfficientNet-lite，EfficientNet的端侧版本，运行在 TensorFlow Lite 上，针对端侧 CPU、GPU 和 EdgeTPU 做了优化。EfficientNet-lite提供五个不同版本（EfficientNet-lite0~4），让用户能够根据自己的应用场景和资源情况在延迟、参数量和精度之间做选择。

03

盘一盘 Python 系列 10 - Keras (上)

Keras 是一个高级的 (high-level) 深度学习框架，作者是 François Chollet。Keras 可以以两种方法运行：

01

了解机器学习/深度学习常用的框架、工具

scikit-learn 官方文档：https://scikit-learn.org/stable/#

00

论文推荐：所有 GAN 的性能都一样吗？

正如您现在听说的那样，生成对抗网络是一种能够从生成器和鉴别器之间的竞争中学习分布的框架。生成器学习生成希望与真实数据无法区分的样本，而鉴别器学习分类给定图像是真实的还是虚假的。自 GAN 发明以来，它们经历了各种改进，被认为是用于各种问题的强大工具，尤其是在生成和重建任务中。

02

那么多GAN哪个好？谷歌大脑泼来冷水：都和原版差不多 | 论文

夏乙编译整理量子位出品 | 公众号 QbitAI 从2014年诞生至今，生成对抗网络（GAN）热度只增不减，各种各样的变体层出不穷。有位名叫Avinash Hindupur的国际友人建立了一个G

06

MNIST 机器学习入门（TensorFlow）

本文是为既没有机器学习基础也没了解过TensorFlow的码农、序媛们准备的。如果已经了解什么是MNIST和softmax回归本文也可以再次帮助你提升理解。在阅读之前，请先确保在合适的环境中安装了TensorFlow（windows安装请点这里，其他版本请官网找），适当编写文章中提到的例子能提升理解。

02

TensorFlow和深度学习入门教程

关键词：Python，tensorflow，深度学习，卷积神经网络正文如下：前言上月导师在组会上交我们用tensorflow写深度学习和卷积神经网络，并把其PPT的参考学习资料给了我们，这是codelabs上的教程：《TensorFlow and deep learning,without a PhD》 https://codelabs.developers.google.com/codelabs/cloud-tensorflow-mnist/#0 当然需要安装python，教程推荐使用pytho

06

深度学习算法优化系列五 | 使用TensorFlow-Lite对LeNet进行训练后量化

在深度学习算法优化系列三 | Google CVPR2018 int8量化算法这篇推文中已经详细介绍了Google提出的Min-Max量化方式，关于原理这一小节就不再赘述了，感兴趣的去看一下那篇推文即可。今天主要是利用tflite来跑一下这个量化算法，量化一个最简单的LeNet-5模型来说明一下量化的有效性。tflite全称为TensorFlow Lite，是一种用于设备端推断的开源深度学习框架。中文官方地址我放附录了，我们理解为这个框架可以把我们用tensorflow训练出来的模型转换到移动端进行部署即可，在这个转换过程中就可以自动调用算法执行模型剪枝，模型量化了。由于我并不熟悉将tflite模型放到Android端进行测试的过程，所以我将tflite模型直接在PC上进行了测试（包括精度，速度，模型大小）。

01

TensorFlow和深度学习入门教程

前言上月导师在组会上交我们用tensorflow写深度学习和卷积神经网络，并把其PPT的参考学习资料给了我们，这是codelabs上的教程：《TensorFlow and deep learning,without a PhD》 https://codelabs.developers.google.com/codelabs/cloud-tensorflow-mnist/#0 当然需要安装python，教程推荐使用python3。好多专业词太难译了，查了下，大家有些都是不译的。比如：dropou

06

TensorFlow下构建高性能神经网络模型的最佳实践

作者 | 李嘉璇责编 | 何永灿随着神经网络算法在图像、语音等领域都大幅度超越传统算法，但在应用到实际项目中却面临两个问题：计算量巨大及模型体积过大，不利于移动端和嵌入式的场景；模型内存占用过大，导致功耗和电量消耗过高。因此，如何对神经网络模型进行优化，在尽可能不损失精度的情况下，减小模型的体积，并且计算量也降低，就是我们将深度学习在更广泛的场景下应用时要解决的问题。加速神经网络模型计算的方向在移动端或者嵌入式设备上应用深度学习，有两种方式：一是将模型运行在云端服务器上，向服务器发送请求，接收服务器

02

深度学习算法优化系列六 | 使用TensorFlow-Lite对LeNet进行训练时量化

在深度学习算法优化系列三 | Google CVPR2018 int8量化算法这篇推文中已经详细介绍了Google提出的Min-Max量化方式，关于原理这一小节就不再赘述了，感兴趣的去看一下那篇推文即可。昨天已经使用tflite测试了训练后量化，所以今天主要来看一下训练时量化时怎么做的。注意训练中的量化实际上是伪量化，伪量化是完全量化的第一步，它只是模拟了量化的过程，并没有实现量化，只是在训练过程中添加了伪量化节点，计算过程还是用float32计算。然后训练得出.pb文件，放到指令TFLiteConverter里去实现第二步完整的量化，最后生成tflite模型，实现int8计算。

02

tensorflow笔记（四）之MNIST手写识别系列一

http://www.cnblogs.com/fydeblog/p/7436310.html

01

玩转TensorFlow深度学习

导语：据介绍，Google Developers Codelabs 提供了有引导的、教程式的和上手式的编程体验。大多数 Codelabs 项目都能帮助你了解开发一个小应用或为一个已有的应用加入新功能的过程。这些应用涉及到很多主题，包括 Android Wear、Google Compute Engine、Project Tango、和 iOS 上的 Google API。本项目的原文可参阅：https://codelabs.developers.google.com/codelabs/cloud-tens

08

图像分类入门，轻松拿下90%准确率 | 教你用Keras搞定Fashion-MNIST

这篇教程会介绍如何用TensorFlow里的tf.keras函数，对Fashion-MNIST数据集进行图像分类。

02

Tensorflow之 CNN卷积神经网络的MNIST手写数字识别

前言 tensorflow中文社区对官方文档进行了完整翻译。鉴于官方更新不少内容，而现有的翻译基本上都已过时。故本人对更新后文档进行翻译工作，纰漏之处请大家指正。（如需了解其他方面知识，可参阅以下Tensorflow系列文章）。深入MNIST TensorFlow是一个非常强大的用来做大规模数值计算的库。其所擅长的任务之一就是实现以及训练深度神经网络。在本教程中，通过为MNIST构建一个深度卷积神经网络的分类器，我们将学到构建一个TensorFlow模型的基本步骤。这个教程假设你已经熟悉神经网络和MNI

05

使用Python实现深度学习模型：知识蒸馏与模型压缩

在深度学习领域，模型的大小和计算复杂度常常是一个挑战。知识蒸馏（Knowledge Distillation）和模型压缩（Model Compression）是两种有效的技术，可以在保持模型性能的同时减少模型的大小和计算需求。本文将详细介绍如何使用Python实现这两种技术。

01

TensorBoard的最全使用教程：看这篇就够了

机器学习通常涉及在训练期间可视化和度量模型的性能。有许多工具可用于此任务。在本文中，我们将重点介绍 TensorFlow 的开源工具套件，称为 TensorBoard，虽然他是TensorFlow 的一部分，但是可以独立安装，并且服务于Pytorch等其他的框架。

05

从零开始学Keras（一）

【导读】Keras是一个由Python编写的开源人工神经网络库，可以作为Tensorflow、和Theano的高阶应用程序接口，进行深度学习模型的设计、调试、评估、应用和可视化。本系列将教你如何从零开始学Keras，从搭建神经网络到项目实战，手把手教你精通Keras。相关内容参考《Python深度学习》这本书。

01

基于Pytorch多机分布式训练的实现

由Uber公司的开发的Horovod架构，是一个集成了多个深度学习的统一平台，提供分布式训练效率的同事，让深度学习分布式训练变得更方便。

05

解决Your CPU supports instructions that this TensorFlow binary was not compiled to

这个错误表示你的CPU支持AVX和AVX2指令集，但是你所使用的TensorFlow二进制文件没有被编译以支持这些指令集。在这篇博客文章中，我们将介绍如何解决这个问题。

02

X射线图像中的目标检测

每天有数百万人乘坐地铁、民航飞机等公共交通工具，因此行李的安全检测将保护公共场所免受恐怖主义等影响，在安全防范中扮演着重要角色。但随着城市人口的增长，使用公共交通工具的人数逐渐增多，在获得便利的同时带来很大的不安全性，因此设计一种可以帮助加快安全检查过程并提高其效率的系统非常重要。卷积神经网络等深度学习算法不断发展，也在各种不同领域（例如机器翻译和图像处理）发挥了很大作用，而目标检测作为一项基本的计算机视觉问题，能为图像和视频理解提供有价值的信息，并与图像分类、机器人技术、人脸识别和自动驾驶等相关。在本项目中，我们将一起探索几个基于深度学习的目标检测模型，以对X射线图像中的违禁物体进行定位和分类为基础，并比较这几个模型在不同指标上的表现。

02

模型压缩一半，精度几乎无损，TensorFlow推出半精度浮点量化工具包，还有在线Demo

近日，TensorFlow模型优化工具包又添一员大将，训练后的半精度浮点量化（float16 quantization）工具。

05

【移动端DL框架】当前主流的移动端深度学习框架一览

大家好，继之前的12大深度学习开源框架之后，我们准备开通新的专栏《移动端DL框架》，这是第一篇文章，先来做一个总体的介绍，更多的细节可以关注以后的文章。

01

模型压缩一半，精度几乎无损，TensorFlow推出半精度浮点量化工具包，还有在线Demo

近日，TensorFlow模型优化工具包又添一员大将，训练后的半精度浮点量化（float16 quantization）工具。

02

TF图层指南：构建卷积神经网络

本文介绍了如何利用TensorFlow搭建一个简单的CNN模型来识别MNIST数据集中的手写数字。首先，介绍了CNN模型的基本原理和TensorFlow中的Keras API。然后，使用MNIST数据集训练了一个具有卷积层和全连接层的CNN模型。最后，通过在测试集上评估模型的性能，得到了97.3%的准确率。

05

如何用神经网络“寻找威利”

本文介绍了一种使用TensorFlow物体检测API寻找特定人物位置的方法。首先，作者通过创建一个包含目标人物位置信息的二维图像，然后使用TensorFlow物体检测API训练一个CNN模型，将图像中的目标人物识别出来。该模型可以用于在其它图像中定位和识别特定人物，具有较好的精度和实时性。

06

独家 | 一文读懂TensorFlow（附代码、学习资料）

人工智能、机器学习和深度学习在介绍TensorFlow（以下简称为TF）之前，我们首先了解一下相关背景。 TF是一种机器学习框架，而机器学习经常和人工智能，深度学习联系在一起，那么三者到底是什么关系呢？简单来讲三者可以理解为包含于被包含的关系。其中最大的是人工智能（以下简称为AI），AI最早起源于1956年的达特茅斯会议，当时AI的几位先驱在会上展示了最早的AI程序：Logic Theorist，能够自动推导数学原理第二章前52个定理中的38个，甚至其中一个定理的证明过程比书中给出的还要优

译文 | 与TensorFlow的第一次接触第四章：单层神经网络

在前言中，已经提到经常使用深度学习的领域就是模式识别。编程初学者都是从打印“Hello World”开始，深度学习中我们则是从识别手写数字开始。本章中，我会讲解如何在TensorFlow中一步步建立单层神经网络，这个建立的神经网络用来识别手写数字，它是基于TensorFlow官方新手指南中的一个例子改变而来。根据本书的风格，在本例子中会简化一些概念与理论证明。如果读者在读完本章后，有兴趣研究例子中相关的理论概念，建议读者去阅读神经网络与深度学习一书，该书同样可在网上获得，该书阐述了本例子中的一些深度理

R语言用灰色模型 GM (1,1)、神经网络预测房价数据和可视化

以苏州商品房房价为研究对象，帮助客户建立了灰色预测模型 GM (1,1)、 BP神经网络房价预测模型，利用R语言分别实现了 GM (1,1)和 BP神经网络房价预测可视化。

00

学生课堂行为识别教学质量评估算法

学生课堂行为识别教学质量评估算法利用教室安装的摄像头，学生课堂行为识别教学质量评估算法对学生的表情状态、课堂表现和互动行为进行全面监测。对学生的参与度、专注度、互动质量等进行评估，为教师提供有关教学效果的实时反馈。可以为教师提供个性化的教学建议和资源，使教学更加针对性和有效性。学生课堂行为识别教学质量评估算法使用到的YOLO框架模型，其全称是You Only Look Once: Unified, Real-Time Object Detection，其实个人觉得这个题目取得非常好，基本上把Yolo算法的特点概括全了：You Only Look Once说的是只需要一次CNN运算，Unified指的是这是一个统一的框架，提供end-to-end的预测，而Real-Time体现是Yolo算法速度快。这里我们谈的是Yolo-v1版本算法，其性能是差于后来的SSD算法的，但是Yolo后来也继续进行改进，产生了Yolo9000算法。本文主要讲述Yolo-v1算法的原理，特别是算法的训练与预测中详细细节，最后将给出如何使用TensorFlow实现Yolo算法。

02

在几分钟内构建强大的可用于生产的深度学习视觉模型

得益于更快的计算，更好的存储和易于使用的软件，基于深度学习的解决方案绝对可以看到从概念验证隧道进入现实世界的曙光！看到深度学习模型已广泛应用于该行业的各个领域，包括医疗保健，金融，零售，技术，物流，食品技术，农业等！考虑到深度学习模型需要大量资源并且经常需要大量计算的事实，因此我们需要暂停片刻，并考虑一下最终用户使用模型时的推断和服务时间。

03

TensorFlow-dev-summit：那些TensorFlow上好玩的和黑科技

本文属于介绍性文章，其中会介绍许多TensorFlow的新feature和summit上介绍的一些有意思的案例，文章比较长，可能会花费30分钟到一个小时

02

十分钟搞定 Tensorflow 服务

Tensorflow 服务是谷歌推荐用来部署 Tensorflow 模型的方法。如果你不具备一定的计算机工程知识背景，即使你对 Tensorflow 本身感觉很顺手，但是我觉得想要搞定 Tensorflow 服务也不是辣么容易的。以下三点是我总结的难点：（谷歌官方）教程含有 C++ 代码（我不会 C++）教程里含有 kubernetes，gRPG，Bezel（其中一些我也是第一次见）需要被编译出来。那个过程时间太长了，恐怕要用一个世纪吧！这里介绍一种可能是最简单的方式——用 tensorflow 服

06

模型体积缩小至千分之一！360算法大牛分享移动端AI部署与优化实践

本文根据360算法专家史东杰在2019年软件绿色联盟开发者大会发表《AI算法在移动端安全实践和优化》主题演讲整理而成，从移动端的使用场景和建模优化两个维度介绍AI算法在360移动端的实践。

01

针对时尚类MINIST数据集探索神经网络

fashion MNIST数据集可以从Github获取。它包含10种类别的灰度图像，共7000个，每个图像的分辨率均为28x28px。下图以25张带有标签的图片向我们展示了该数据集中的数据。

01

加州大学华人女博士提出全新高效NAS算法：AutoML一次「训练」适配亿万硬件

近日，由加州大学河滨分校主导、乔治梅森和圣母大学共同合作的团队提出，可以利用延迟的单调性来从根本上促进硬件适配NAS —— 即不同设备上的神经架构延迟排名通常是相关的。

01

深度学习与神经网络:mnist数据集实现手写数字识别

对于mnist数据集,具体的一些介绍我这里就不搬运过来了,这里我直接说我们如何在TensorFlow上使用mnist数据集.

深度学习与神经网络:mnist数据集实现手写数字识别

大家好,在这一篇文章中,我们将做以下的三件事: 1:介绍mnist数据集的使用 2:创建模型,并且保存模型 3:在测试集中使用保存的模型进行检测一:介绍mnist数据集的使用对于mnist数据集,具体的一些介绍我这里就不搬运过来了,这里我直接说我们如何在TensorFlow上使用mnist数据集. 在我们将mnist数据集准备喂入神经网络时,我们需要提前对数据集进行处理,因为数据集的大小是28*28像素,我们就将每张图片处理成长度784的一维数组,将这个数组作为神经网络的训练特征喂入神经网络. 举个例子

04

云原生的弹性 AI 训练系列之一：基于 AllReduce 的弹性分布式训练实践

高策，腾讯高级工程师，Kubeflow 社区训练和自动机器学习工作组 Tech Lead，负责腾讯云 TKE 在 AI 场景的研发和支持工作。张望，腾讯高级工程师，从事 GPU 虚拟化和分布式训练加速，负责腾讯云 TKE 在 AI 场景的研发和支持工作。引言随着模型规模和数据量的不断增大，分布式训练已经成为了工业界主流的 AI 模型训练方式。基于 Kubernetes 的 Kubeflow 项目，能够很好地承载分布式训练的工作负载，业已成为了云原生 AI 领域的事实标准，在诸多企业内广泛落地。尽管

01

tensorflow2.0手写数字识别_tensorflow手写汉字识别

手写识别的应用场景有很多，智能手机、掌上电脑的信息工具的普及，手写文字输入，机器识别感应输出；还可以用来识别银行支票，如果准确率不够高，可能会引起严重的后果。当然，手写识别也是机器学习领域的一个Hello World任务，感觉每一个初识神经网络的人，搭建的第一个项目十之八九都是它。

02

tensorflow2.0手写数字识别(tensorflow手写体识别)

本节笔记作为 Tensorflow 的 Hello World，用 MNIST 手写数字识别来探索 Tensorflow。笔记的内容来自 Tensorflow 中文社区和黄文坚的《Tensorflow 实战》，只作为自己复习总结。

04

初学者怎么选择神经网络环境？对比MATLAB、Torch和TensorFlow

选自arXiv 机器之心编译参与：吴攀、蒋思源、李亚洲初学者在学习神经网络的时候往往会有不知道从何处入手的困难，甚至可能不知道选择什么工具入手才合适。近日，来自意大利的四位研究者发布了一篇题为《神经网络初学者：在 MATLAB、Torch 和 TensorFlow 中的快速实现（Neural Networks for Beginners A fast implementation in Matlab, Torch, TensorFlow）》的论文，对 MATLAB、Torch 和 TensorFlow

【译】TensorFlow实现Batch Normalization

原文：Implementing Batch Normalization in Tensorflow 来源：R2RT 译者注：本文基于一个最基础的全连接网络，演示如何构建Batch Norm层、

06

评测 | CNTK在Keras上表现如何？能实现比TensorFlow更好的深度学习吗？

选自MiniMaxir 作者：Max Woolf 机器之心编译参与：Jane W、吴攀 Keras 是由 François Chollet 维护的深度学习高级开源框架，它的底层基于构建生产级质量的深度学习模型所需的大量设置和矩阵代数。Keras API 的底层基于像 Theano 或谷歌的 TensorFlow 的较低级的深度学习框架。Keras 可以通过设置 flag 自由切换后端（backend）引擎 Theano/TensorFlow；而不需要更改前端代码。虽然谷歌的 TensorFlow 已广受

05

飞桨万能转换小工具X2Paddle，教你玩转模型迁移

百度推出飞桨（PaddlePaddle）后，不少开发者开始转向国内的深度学习框架。但是从代码的转移谈何容易，之前的工作重写一遍不太现实，成千上万行代码的手工转换等于是在做一次二次开发。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭