开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

使用tf slim重新训练预训练的ResNet-50模型以实现分类目的

是一种常见的深度学习任务。下面是对这个问题的完善且全面的答案：

概念：
- tf slim：tf slim是TensorFlow的一个高级API，用于简化深度学习模型的定义和训练过程。
- 预训练模型：预训练模型是在大规模数据集上预先训练好的深度学习模型，通常用于迁移学习和快速模型训练。
- ResNet-50：ResNet-50是一种深度残差网络，具有50层的深度，通过引入残差连接解决了深度网络训练中的梯度消失问题。

分类目的：使用tf slim重新训练预训练的ResNet-50模型可以实现图像分类的目的。通过将模型重新训练在特定的图像分类任务上，可以使其具备识别和分类不同类别图像的能力。
实现步骤：
- 导入tf slim和其他必要的库。
- 加载预训练的ResNet-50模型，并根据分类任务的类别数量调整模型的最后一层。
- 定义损失函数和优化器。
- 加载训练数据集，并进行数据预处理。
- 进行模型训练，通过反向传播更新模型参数。
- 在验证集上评估模型性能，根据需要进行调整和优化。
- 使用训练好的模型进行图像分类预测。
推荐的腾讯云相关产品和产品介绍链接地址：
- 腾讯云AI智能图像识别：https://cloud.tencent.com/product/ai_image
- 腾讯云GPU云服务器：https://cloud.tencent.com/product/cvm_gpu
- 腾讯云弹性MapReduce：https://cloud.tencent.com/product/emr
- 腾讯云对象存储COS：https://cloud.tencent.com/product/cos

请注意，以上推荐的腾讯云产品仅供参考，实际选择应根据具体需求和情况进行评估。

相关搜索:为什么我只有在使用预训练的slim模型时才会得到双信息字符串？使用支持向量机分类器作为预训练模型(VGG16)的最后一层使用预训练的BERT模型进行错误多类文本分类在TF-Hub上加载预训练模型，以计算Gensim或spaCy上的单词移位器距离在使用训练-测试拆分后，我是否应该用整个数据集重新训练模型，以找到最佳的超参数？如何使用Keras中的h5类型的预训练图像分类模型？如何在Keras上使用Glorot重新初始化预训练模型的权重？如何在tf.keras中去除预训练模型的输入层，并使用不同的输入层作为模型的输入？尝试使用先前训练的tf.keras模型作为预训练，但得到"ValueError:图层dense_3的输入0与图层不兼容当使用tensorflow对象检测api重新训练预先训练的模型时，为什么以这种方式标记训练数据会导致不良对象检测？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

兼容性Up！Object Detection API 现已支持 TensorFlow 2

作者 | Vivek Rathod 和 Jonathan Huang，Google Research

01

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

选自Medium 作者：Thalles Silva 机器之心编译参与：Nurhachu Null、刘晓坤深度卷积神经网络在各类计算机视觉应用中取得了显著的成功，语义分割也不例外。这篇文章介绍了语义分割的 TensorFlow 实现，并讨论了一篇和通用目标的语义分割最相关的论文——DeepLab-v3。DeepLab-v3 是由谷歌开发的语义分割网络，近日，谷歌还开源了该系列的最新版本——DeepLab-v3+。 GitHub 地址：https://github.com/sthalles/deeplab_

05

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

选自Medium 作者：Thalles Silva 机器之心编译参与：Nurhachu Null、刘晓坤深度卷积神经网络在各类计算机视觉应用中取得了显著的成功，语义分割也不例外。这篇文章介绍了语义分割的 TensorFlow 实现，并讨论了一篇和通用目标的语义分割最相关的论文——DeepLab-v3。DeepLab-v3 是由谷歌开发的语义分割网络，近日，谷歌还开源了该系列的最新版本——DeepLab-v3+。 GitHub 地址：https://github.com/sthalles/deeplab_

07

【C++】和【预训练模型】实现【机器学习】【图像分类】的终极指南

在现代机器学习和人工智能应用中，图像分类是一个非常常见且重要的任务。通过使用预训练模型，我们可以显著减少训练时间并提高准确性。C++作为一种高效的编程语言，特别适用于需要高性能计算的任务。

01

ResNet原理及其在TF-Slim中的实现

01 摘要微软的深度残差网络ResNet源于2016年CVPR最佳论文---图像识别中的深度残差学习（Deep Residual Learning for Image Recognition）https://www.leiphone.com/news/201606/BhcC5LV32tdot6DD.html 这个152层ResNet架构深，除了在层数上面创纪录，ResNet 的错误率也低得惊人，达到了3.6%，人类都大约在5%~10%的水平。这是目前为止最好的深度学习框架。可以看作人工神经网络领域的又一里

07

在几分钟内构建强大的可用于生产的深度学习视觉模型

得益于更快的计算，更好的存储和易于使用的软件，基于深度学习的解决方案绝对可以看到从概念验证隧道进入现实世界的曙光！看到深度学习模型已广泛应用于该行业的各个领域，包括医疗保健，金融，零售，技术，物流，食品技术，农业等！考虑到深度学习模型需要大量资源并且经常需要大量计算的事实，因此我们需要暂停片刻，并考虑一下最终用户使用模型时的推断和服务时间。

03

深入探究深度卷积语义分割网络和 Deeplab_V3

深度卷积神经网络（DCNN）在各种计算机视觉应用中取得了显着的成功。当然，语义分割的任务也不例外。

02

ResNet原理及其在TF-Slim中的实现

摘要微软的深度残差网络ResNet源于2016年CVPR最佳论文---图像识别中的深度残差学习（Deep Residual Learning for Image Recognition）（https

04

资源 | GitHub新项目：轻松使用多种预训练卷积网络抽取图像特征

选自GitHub 机器之心整理参与：思源最近 GitHub 有一个非常有意思的项目，它可以使用多种预训练 TensorFLow 模型计算图像特征。对于每一个模型，它们都会输出最后的全连接层，即 AlexNet 的第七个全连接层、VGG_19 的第 8 个全连接层等。这些层级将最终抽取出图像的特征，并能进一步用于图像分类和聚类等。机器之心简要地介绍了该项目，并测试了使用Inception_V1预训练模型抽取图像特征。项目地址：https://github.com/cameronfabbri/Comput

06

TensorFlow-Slim图像分类库

本文介绍了如何使用深度学习模型进行图像分类，并探讨了在训练和评估模型时出现的问题及解决方案。

06

基于slim的残差网络

slim中给出了resnet、vgg卷积网络的快速实现方法，定义的位置为:D:\anaconda\envs\tensorflow\Lib\site-packages\tensorflow\contrib\slim\python\slim\nets，构建残差网络主要使用的模块为resnet_utils.py、resnet_v1.py、resnet_v2.py。下面

03

异类框架BigDL，TensorFlow的潜在杀器！

【导读】你能利用现有的 Spark 集群构建深度学习模型吗？如何分析存储在 HDFS、Hive 和 HBase 中 tb 级的数据吗？企业想用深度学习模型，可是要考虑的问题又很多，怎么破？这篇文章中，我们将给大家讲讲大数据+深度学习下，BigDL 框架的利弊与应用教程，为什么有了 TF、PyTorch，还是会考虑用 BigDL？

03

Google最新开源Inception-ResNet-v2，进一步提升图像分类水准

2016年8月31日，Google团队宣布针对TensorFlow开源了最新发布的TF-slim资料库，它是一个可以定义、训练和评估模型的轻量级的软件包，也能对图像分类领域中几个主要有竞争力的网络进行检验和定义模型。为了进一步推进这个领域的进步，今天Google团队宣布发布Inception-ResNet-v2（一种卷积神经网络——CNN），它在ILSVRC图像分类基准测试中实现了当下最好的成绩。Inception-ResNet-v2是早期Inception V3模型变化而来，从微软的残差网络（ResNe

04

使用ResNet101作为预训练模型训练Faster-RCNN-TensorFlow-Python3-master[通俗易懂]

使用VGG16作为预训练模型训练Faster-RCNN-TensorFlow-Python3-master的详细步骤→Windows10+Faster-RCNN-TensorFlow-Python3-master+VOC2007数据集。

01

DeepMind开源最牛无监督学习BigBiGAN预训练模型（附论文&代码）

近日，DeepMind发布了预训练的BigBiGAN表示学习模型，开源代码可以在TF Hub上找到。

03

快速图像风格转换代码解析

风格转换训练包含了所有转换步骤,有图像风格特征提取,图像内容损失提取,图像风格损失提取,图像内容和风格损失融合等过程,下面针对训练解析各个过程.

03

TF-Slim ImageNet数据集制作

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/Gavin__Zhou/article/details/80242998

02

2015年的ResNet潜力都挖掘出来了吗？新研究：不用蒸馏、无额外数据，性能还能涨一波

在计算机视觉领域，何恺明等人 2015 年提出的 ResNet（deep residual network，深度残差网络）一直被视为经典架构，它解决了深度 CNN 模型难训练的问题，是 CNN 图像史上的一个里程碑之作。

01

2015年的ResNet潜力都挖掘出来了吗？新研究：不用蒸馏、无额外数据，性能还能涨一波

机器之心报道编辑：杜伟、张倩基线：我要是用上最新的训练流程，性能还能涨一波。在计算机视觉领域，何恺明等人 2015 年提出的 ResNet（deep residual network，深度残差网络）一直被视为经典架构，它解决了深度 CNN 模型难训练的问题，是 CNN 图像史上的一个里程碑之作。自提出以来，ResNet 系列模型一直被用作研究中的默认架构，或者新模型提出时用来对比的基线。然而，在过去的几年里，神经网络训练方面的最佳实践已经取得了很大进展。新颖的优化、数据增强等方法提高了训练流程的有效

01

AI识万物：从0搭建和部署手语识别系统 ⛵

据北京听力协会预估数据，我国听障人群数量已过千万。而在全球范围内有4.66亿人患有残疾性听力损失，约占全世界人口的5%。聋哑人士很特殊，他们需要使用手语进行交流，其他与常人无异，我国存在特殊教育水平在各城市中发展力度具有较大差异，国家通用手语推广程度浅，但不懂手语，与听力障碍者交流会非常困难。

04

arxiv | Swin Transformer:使用移动窗口的分层Vision Transformer

今天给大家介绍的是微软亚洲研究院的一篇文章”Swin Transformer: Hierarchical Vision Transformer using Shifted Windows”。从语言到视觉应用Transformer的挑战来源于两个领域的差异，例如和文本字词相比视觉实体的复杂变化以及图像像素的高分辨率两方面的差异。为了解决这样的问题，作者在这篇文章中提出一种称为Swin Transformer新型Vision Transformer。Swin Transformer使用允许跨窗口连接的移动窗口将自注意力限制在不重叠的局部窗口上计算表示，其提出的层次结构具有不同尺度上图像上建模的灵活性，在各种视觉任务上取得优秀的结果，有望在计算机视觉领域取代CNN成为一种通用框架。

04

DeepMind开源最牛无监督学习BigBiGAN预训练模型

近日，DeepMind发布了预训练的BigBiGAN表示学习模型，开源代码可以在TF Hub上找到。

04

业界 | 现代「罗塞塔石碑」：微软提出深度学习框架的通用语言

选自arXiv 作者：Ilia Karmanov等机器之心编译参与：路雪、刘晓坤、白妤昕深度学习框架就像语言一样：很多人会说英语，但每种语言都有自己的特殊性。作者为几种不同的网络结构创建了通用代码，并可在多个不同的框架中使用。 repo 1.0 完整版 GitHub 地址：https://github.com/ilkarman/DeepLearningFrameworks 我们的想法是创建一个深度学习框架的罗塞塔石碑（Rosetta Stone）：假设你很了解某个深度学习框架，你就可以帮助别人使用任何

04

理解并实现 ResNet（Keras）

ResNet 是残差网络(Residual Network)的缩写，是一种作为许多计算机视觉任务主干的经典神经网络。这个模型是2015年ImageNet挑战赛的获胜者，ResNet最根本的突破在于它使得我们可以训练成功非常深的神经网路，如150+层的网络。在ResNet之前，由于梯度消失(vanishing gradients)的问题，训练非常深的神经网络是非常困难的。

04

如何用TensorFlow和TF-Slim实现图像标注、分类与分割

本文github源码地址：在公众号 datadw 里回复图像即可获取。笔者将和大家分享一个结合了TensorFlow和slim库的小应用，来实现图像分类、图像标注以及图像分割的任务，围绕着slim展开，包括其理论知识和应用场景。之前自己尝试过许多其它的库，比如Caffe、Matconvnet、Theano和Torch等。它们各有优劣，而我想要一个可靠灵活的、自带预训练模型的Python库。最近，新推出了一款名叫slim的库，slim自带了许多预训练的模型，比如ResNet、VGG、Ince

04

图像识别泛化能力人机对比：CNN比人类还差得远

我们通过 12 种不同类型的图像劣化（image degradation）方法，比较了人类与当前的卷积式深度神经网络（DNN）在目标识别上的稳健性。首先，对比三种著名的 DNN（ResNet-152、VGG-19、GoogLeNet），我们发现不管对图像进行怎样的操作，几乎所有情况下人类视觉系统都更为稳健。我们还观察到，当信号越来越弱时，人类和 DNN 之间的分类误差模式之间的差异会逐渐增大。其次，我们的研究表明直接在畸变图像上训练的 DNN 在其所训练的同种畸变类型上的表现总是优于人类，但在其它畸变类型上测试时，DNN 却表现出了非常差的泛化能力。比如，在椒盐噪声上训练的模型并不能稳健地应对均匀白噪声，反之亦然。因此，训练和测试之间噪声分布的变化是深度学习视觉系统所面临的一大关键难题，这一难题可通过终身机器学习方法而系统地解决。我们的新数据集包含 8.3 万个精心度量的人类心理物理学试验，能根据人类视觉系统设置的图像劣化提供对终身稳健性的有用参考。

02

Opencv+TF-Slim实现图像分类及深度特征提取

TF-Slim是一个用于定义、训练和评估复杂模型的tensorflow轻量级库，在slim库中已经有很多官方实现的网络并用ImageNet进行了预训练，如VGG、ResNet、Inception等，可直接拿来使用。本文将用Opencv的dnn模块调用预训练的InceptionV4模型进行图像分类及深度特征的提取。

06

重新标注128万张ImageNet图片：多标签，全面提升模型性能

ImageNet 是机器学习社区最流行的图像分类基准数据集，包含超过 1400 万张标注图像。该数据集由斯坦福教授李飞飞等人于 2006 年开始创建，后成为评估计算机视觉模型在下游视觉任务中能力的试金石。

03

使用tensorflow 的slim模块fine-tune resnet/densenet/inception网络，解决batchnorm问题

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_25737169/article/details/79616671

02

EAST 自然场景文本检测实践(EAST: An Efficient and Accurate Scene Text Detector)

本文介绍了一种基于深度学习的场景文本检测算法，该算法使用FCN网络对输入图像进行像素级别的语义分割，并通过多尺度融合策略生成包含文本候选框的图像，最后使用基于聚类的文本识别方法对候选框进行分类，从而实现对场景文本的检测。实验部分验证了该算法的有效性，与其他文本检测算法相比，具有较好的性能。

07

python人工智能：完整的图片识别(非图片验证码)，以及模型的使用

这个可以说是一个绝对的福利中的福利。一整套的AI图片识别以及模型的使用。一直都在说人工智能，图像识别，又有几个人会呢，网上文章成山，前一段时间因工作需要，我一个做后端开发的，要做图片识别。

01

重新标注128万张ImageNet图片：多标签，全面提升模型性能 | 留言送书

ImageNet 是机器学习社区最流行的图像分类基准数据集，包含超过 1400 万张标注图像。该数据集由斯坦福教授李飞飞等人于 2006 年开始创建，后成为评估计算机视觉模型在下游视觉任务中能力的试金石。

02

分类干货实践 | 重新标注128万张ImageNet图片：多标签，全面提升模型性能

ImageNet 是机器学习社区最流行的图像分类基准数据集，包含超过 1400 万张标注图像。该数据集由斯坦福教授李飞飞等人于 2006 年开始创建，后成为评估计算机视觉模型在下游视觉任务中能力的试金石。

03

python人工智能：完整的图片识别(非图片验证码)，以及模型的使用

这个可以说是一个绝对的福利中的福利。一整套的AI图片识别以及模型的使用。一直都在说人工智能，图像识别，又有几个人会呢，网上文章成山，前一段时间因工作需要，我一个做后端开发的，要做图片识别。

02

ResNet50 文艺复兴 | ViT 原作者让 ResNet50 精度达到82.8%，完美起飞！！！

大型视觉模型目前主导着计算机视觉的许多领域。最新的图像分类、目标检测或语义分割模型都将模型的大小推到现代硬件允许的极限。尽管它们的性能令人印象深刻，但由于计算成本高，这些模型很少在实践中使用。

03

神奇的Batch Normalization 仅训练BN层会发生什么

最近，我阅读了arXiv平台上的Jonathan Frankle，David J. Schwab和Ari S. Morcos撰写的论文“Training BatchNorm and Only BatchNorm: On the Expressive Power of Random Features in CNNs”。这个主意立刻引起了我的注意。到目前为止，我从未将批标准化（BN）层视为学习过程本身的一部分，仅是为了帮助深度网络实现优化和提高稳定性。经过几次实验，我发现我错了。在下文中，我将展示我复制的论文的结果以及从中学到的东西。

01

无需预训练分类器，清华和旷视提出专用于目标检测的骨干网络DetNet

选自arXiv 作者：Zeming Li、Chao Peng、Gang Yu、Xiangyu Zhang、Yangdong Deng、Jian Sun 机器之心编译参与：路雪、刘晓坤基于当前用预训练分类器开发目标检测器的方法的固有缺陷，来自清华大学和旷视的研究者提出了专用于目标检测的骨干网络 DetNet。DetNet 可在保持高分辨率特征图和大感受野的同时，高效地执行目标检测任务，并可以自然地扩展到实例分割任务上。在 MSCOCO 数据集的目标检测和实例分割任务上，DetNet 都取得了当前最佳的结果

09

通俗易懂：图解10大CNN网络架构

导语：近年来，许多卷积神经网络（ CNN ）跃入眼帘，而随着其越来越深的深度，我们难以对某个 CNN 的结构有较明确的了解。因此本文精心选取了 10 个 CNN 体系结构的详细图解进行讲述。

04

工具组件 | 模型转换工具X2Paddle操作大全

深度学习的应用主要包括两个部分，一是通过深度学习框架训练出模型，二是利用训练出来的模型进行预测。

04

一文看懂如何使用模型转换工具X2Paddle

深度学习的应用主要包括两个部分，一是通过深度学习框架训练出模型，二是利用训练出来的模型进行预测。

03

10亿级数据规模的半监督图像分类模型，Imagenet测试精度高达81.2％ | 技术头条

作者| I. Zeki Yanlniz, Herve Jegou, Kan Chen, Manohar Paluri, Dhruv Mahajan

04

何恺明、吴育昕最新成果：用组归一化替代批归一化

编译 | 阿司匹林 AI科技大本营按：近日，FAIR 团队的吴育昕和何恺明提出了组归一化（Group Normalization，简称 GN）的方法。其中，GN 将信号通道分成一个个组别，并在每个组别内计算归一化的均值和方差，以进行归一化处理。此外，GN 的计算与批量大小无关，而且在批次大小大幅变化时，精度依然稳定。实验结果证明，GN 在多个任务中的表现均优于基于 BN 的同类算法，这表明 GN 能够在一系列任务中有效地替代 BN。以下内容来自 Group Normalization 论文，AI科技大

05

谷歌开放一种新的图像分类卷积神经网络模型

为了在该领域取得更多进展，今天我们非常高兴的宣布开放 Inception-ResNet-v2，这是一个在 ILSVRC 图像分类基准上取得顶尖准确率的卷积神经网络。Inception-ResNet-v2 是早期发布的 Inception V3 模型的变体，该模型借鉴了微软 ResNet 论文中的思路。具体内容可在我们的论文：Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning 中看到。残差连接（R

09

FAIR何恺明等人提出组归一化：替代批归一化，不受批量大小限制

选自arXiv 作者：吴育昕、何恺明机器之心编译自 Facebook 在 2017 年 6 月发布 1 小时训练 ImageNet 论文以来，很多研究者都在关注如何使用并行训练来提高深度学习的训练速度，其研究所使用的批尺寸也呈指数级上升。近日，FAIR 研究工程师吴育昕、研究科学家何恺明提出了组归一化（Group Normalization）方法，试图以小批尺寸实现快速神经网络训练，这种方法对于硬件的需求大大降低，并在实验中超过了传统的批归一化方法。批归一化（Batch Norm/BN）是深度学习中非

07

丢人！Caffe2推出才几天，就被谷歌TensorFlow吊打了

两周前，Facebook大张旗鼓地开源了Caffe2深度学习框架，它在英伟达DGX-1平台上的高性能表现极为亮眼。 Google立刻动手反制，没几天就给出新版的TensorFlow测试数据，在性能上开始压制Caffe2。由此看来，要在人工智能上赶超Google，Facebook仅仅靠模仿还是不够的，而Google也绝不甘心坐以待毙。不管怎么说，留给Facebook的时间不多了。我们先来对比一下双方的测试结果：除了VGG16模型测试中的8核数据，其余结果上TensorFlow均处于优势。

06

FAIR何恺明等人提出组归一化：替代批归一化，不受批量大小限制

选自arXiv 作者：吴育昕、何恺明机器之心编译自 Facebook 在 2017 年 6 月发布 1 小时训练 ImageNet 论文以来，很多研究者都在关注如何使用并行训练来提高深度学习的训练速度，其研究所使用的批尺寸也呈指数级上升。近日，FAIR 研究工程师吴育昕、研究科学家何恺明提出了组归一化（Group Normalization）方法，试图以小批尺寸实现快速神经网络训练，这种方法对于硬件的需求大大降低，并在实验中超过了传统的批归一化方法。批归一化（Batch Norm/BN）是深度学习中非

06

谷歌开源图像分类工具TF-Slim，定义TensorFlow复杂模型

【新智元导读】谷歌今天宣布开源 TensorFlow 高级软件包 TF-Slim，能使用户快速准确地定义复杂模型，尤其是图像分类任务。这不由让人想起 Facebook 上周开源“从像素级别理解图像”的计算机视觉系统。不管怎么说，在计算机视觉方面，强大的工具又多了。下文是官方博文翻译。今年早些时候，我们发布了图像分类模型 Inception V3 在 TensorFlow 上的运行案例。代码能够让用户使用同步梯度下降用 ImageNet 分类数据库训练模型。Inception V3 模型的基础是一个叫做 T

06

不是每张图都要高清，华为诺亚动态分辨率网络入选NeurIPS 2021

该论文指出识别每张图片所需要的最小分辨率是不同的，而现有方法并没有充分挖掘输入分辨率的冗余性，也就是说输入图片的分辨率不应该是固定的。论文进一步提出了一种动态分辨率网络 DRNet，其分辨率根据输入样本的内容动态决定。一个计算量可以忽略的分辨率预测器和我们所需要的图片分类网络一起优化训练。在推理过程中，每个输入分类网络的图像将被调整到分辨率预测器所预测的分辨率，以最大限度地减少整体计算负担。

01

重磅! | 比Pytorch Hub更早？三分钟带你弄懂Paddle Hub！

前言：昨天看到一条爆炸性新闻—"PyTorch Hub发布！一行代码调用最潮模型"，在我们调参圈简直震惊了！要是所有模型都能一行命令解决，我也不用一天到晚当调参这么苦兮兮T_T。不过我突然想起，上个月我还用过PaddleHub做Fine-tune，很好用，咋没人推荐呢？好用的东西当然要跟大家分享，所以我做了一个非官方测评，三分钟带大家了解PaddleHub！

03

Keras和PyTorch的视觉识别与迁移学习对比

在上一篇文章中，我们简述了Keras和PyTorch的区别，旨在帮助你选择更适合你需求的框架。现在，我们进行实战进行。我们将让Keras和PyTorch互相较量以展示他们的优劣。我们使用的问题是：区分异形和铁血战士。

04

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭