开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

具有其他输入形状和图像网权重的VGG16

VGG16是一种深度卷积神经网络模型，它在计算机视觉领域被广泛应用于图像分类、目标检测和图像分割等任务。VGG16由牛津大学的研究团队开发，其名称来源于模型中包含16个卷积层和全连接层的结构。

VGG16的主要特点是使用了较小的卷积核尺寸（3x3）和更深的网络结构，以提高模型的表达能力和准确性。它采用了多个卷积层和池化层的堆叠，通过逐渐减小特征图的尺寸和增加通道数来提取图像的高级特征。最后，通过全连接层将提取到的特征映射到不同的类别上。

VGG16的优势在于其简单而有效的网络结构，使得它易于理解和实现。同时，由于其深度较大，VGG16能够学习到更复杂的图像特征，从而在图像分类等任务上取得较好的性能。

VGG16的应用场景包括但不限于：

图像分类：VGG16可以用于对图像进行分类，例如将图像分为不同的物体类别。
目标检测：通过在VGG16的基础上添加额外的检测层，可以实现对图像中目标位置的检测和定位。
图像分割：通过对VGG16进行适当的修改，可以实现对图像中不同区域的分割。

腾讯云提供了一系列与图像处理和人工智能相关的产品，以下是一些推荐的产品和对应的介绍链接地址：

腾讯云图像识别（https://cloud.tencent.com/product/imagerecognition）：提供了丰富的图像识别能力，包括图像标签、人脸识别、文字识别等功能。
腾讯云智能视频分析（https://cloud.tencent.com/product/vca）：基于深度学习技术，提供了视频内容分析、人脸识别、行为分析等功能。
腾讯云智能语音合成（https://cloud.tencent.com/product/tts）：将文字转换为自然流畅的语音输出，可用于语音助手、语音广播等场景。

需要注意的是，以上产品仅为腾讯云提供的一部分相关产品，更多产品和服务可以在腾讯云官网上进行了解和查找。

相关搜索:了解具有2-D输入张量的LSTM单元的权重形状 SwiftUI:如何覆盖具有多个形状和依赖位置的图像 Solr -组合自动爬网值和其他手动输入的数据 Tensorflow错误: ValueError:形状必须具有相同的等级，但形状%1与其他形状合并的结果是%2和%1 从还具有锚和图像标签的输入更新列表的html 使用哪个web框架或库在网页上显示PNG图像和基本形状，每个图像具有唯一的url？检查输入时出错:在图像分割中，要求input_6具有形状(80，80，1)，但得到形状为(80，80,2400)的数组尺寸必须相等，但对于具有输入形状[1, 15 ]，[1,500]的'MatMul_1‘(op：'MatMul')，尺寸必须为15和1 尺寸必须相等，但对于具有输入形状[ 128 ,1]，[64,128]的'sampled_softmax_loss/MatMul‘(op：'MatMul')，尺寸必须为1和128 maven3

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

keras系列︱Application中五款已训练模型、VGG16框架（Sequential式、Model式）解读（二）

根据给定的文章内容，撰写摘要总结。

08

什么是迁移学习（Transfer Learning）？【精讲+代码实例】

我们一直听过一句话叫，“如果说我看得比别人更远些，那是因为我站在巨人的肩膀上。（If I have seen further, it is by standing on the shoulders of giants.）”。“站在巨人的肩膀上”，不仅能看得更远,还能看到更多。这也用来表达我们要善于学习先辈的经验, 一个人的成功往往还取决于先辈们累积的知识。这句话, 放在机器学习中, 这就是今天要说的迁移学习（transfer learning）。

01

keras系列︱深度学习五款常用的已训练模型

不得不说，这深度学习框架更新太快了尤其到了Keras2.0版本，快到Keras中文版好多都是错的，快到官方文档也有旧的没更新，前路坑太多。到发文为止，已经有theano/tensorflow/CNTK支持keras,虽然说tensorflow造势很多，但是笔者认为接下来Keras才是正道。笔者先学的caffe，从使用来看，keras比caffe简单超级多，非常好用，特别是重新训练一个模型，但是呢，在fine-tuning的时候，遇到了很多问题，对新手比较棘手。中文文档：http://keras-

07

实时视频上的神经风格迁移（具有完整的可实现代码）

近几年来，经历了计算机视觉在生活中几乎每个角落的应用 - 得益于大量数据和超级动力GPU的可用性，这些GPU已经对卷积神经网络进行了训练和部署（CNN）超级容易。今天在机器学习中最有趣的讨论之一是它如何在未来几十年影响和塑造文化和艺术生产。神经风格迁移是卷积神经网络最具创造性的应用之一。

03

深度学习模型系列(1) | VGG16 Keras实现

VGGNet是牛津大学视觉几何组(Visual Geometry Group)提出的模型，该模型在2014ImageNet图像分类与定位挑战赛 ILSVRC-2014中取得在分类任务第二，定位任务第一的优异成绩。VGGNet突出的贡献是证明了很小的卷积，通过增加网络深度可以有效提高性能。

04

keras系列︱深度学习五款常用的已训练模型

不得不说，这深度学习框架更新太快了尤其到了Keras2.0版本，快到Keras中文版好多都是错的，快到官方文档也有旧的没更新，前路坑太多。到发文为止，已经有theano/tensorflow/CNTK支持keras,虽然说tensorflow造势很多，但是笔者认为接下来Keras才是正道。

01

资源 | 从VGG到ResNet，你想要的MXNet预训练模型轻松学

选自AWS Blog 作者：Julien Simon 机器之心编译参与：Pedro、路本文介绍了如何利用 Apache MXNet 预训练出的多个模型。每个模型在特定图像上的表现略有不同，训练多个模型旨在找出更适合特定任务的模型。在这篇博文中，你将会了解如何使用 Apache MXNet 预训练出的多个模型。为什么要尝试多个模型呢？为什么不直接选择准确率最高的呢？稍后我们会在文章中看到，尽管这些模型是在相同的数据集上训练的，并且都针对最大准确率进行了优化，但它们在特定图像上的表现略有不同。此外，（不同

04

神经风格迁移指南（第一部分）

在本系列中，我们会从神经风格的基础开始，你将从中学到一种自下而上(从基础开始)的方法。对于初学者而言，我们将会详细讲解神经风格到底是什么，以及它的工作原理。本文是连载中的系列文章的第一部分，将由我与 Pawan Sasanka Ammanamanchi 共同完成。本系列长期连载，我们将努力覆盖这个领域的研究，并且不断增加新的文章。目前，实现这一目标的先决条件如下：

02

别磨叽，学完这篇你也是图像识别专家了

图像识别是当今深度学习的主流应用，而Keras是入门最容易、使用最便捷的深度学习框架，所以搞图像识别，你也得强调速度，不能磨叽。本文让你在最短时间内突破五个流行网络结构，迅速达到图像识别技术前沿。

07

keras实现VGG16方式(预测一张图片)

这是两种不同的方式，第一种是直接使用vgg16的参数，需要在运行时下载，第二种是我们已经下载好的权重，直接在参数中输入我们的路径即可。

03

阿猫还是阿狗？AI视觉识别中目标检测的关键技术

内容来源：2018 年 04 月 21 日，AI教育求职平台景略集智创始人王文凯在“百度深度学习公开课·北京站：AI工程师的快速进阶之路”进行《目标检测面面观》演讲分享。IT 大咖说（微信id：itdakashuo）作为独家视频合作方，经主办方和讲者审阅授权发布。

01

从零开始学keras（八）

想要将深度学习应用于小型图像数据集，一种常用且非常高效的方法是使用预训练网络。预训练网络（pretrained network）是一个保存好的网络，之前已在大型数据集（通常是大规模图像分类任务）上训练好。如果这个原始数据集足够大且足够通用，那么预训练网络学到的特征的空间层次结构可以有效地作为视觉世界的通用模型，因此这些特征可用于各种不同的计算机视觉问题，即使这些新问题涉及的类别和原始任务完全不同。举个例子，你在 ImageNet 上训练了一个网络（其类别主要是动物和日常用品），然后将这个训练好的网络应用于某个不相干的任务，比如在图像中识别家具。这种学到的特征在不同问题之间的可移植性，是深度学习与许多早期浅层学习方法相比的重要优势，它使得深度学习对小数据问题非常有效。

01

Deep learning with Python 学习笔记（3）

想要将深度学习应用于小型图像数据集，一种常用且非常高效的方法是使用预训练网络。预训练网络(pretrained network)是一个保存好的网络，之前已在大型数据集(通常是大规模图像分类任务)上训练好

02

AI 技术讲座精选：通过学习Keras从零开始实现VGG网络

Keras代码示例多达数百个。通常我们只需复制粘贴代码，而无需真正理解这些代码。通过学习本教程，您将搭建非常简单的构架，但是此过程会带给您些许好处：您将通过阅读 VGG*的论文原著学习使用 Keras 从零开始实现 VGG 网络。我使用的术语是指由牛津大学计算机视觉组 (Visual Geometry Group， VGG)为ILSVRC-2014构建的网络构架。那么，实现别人构建出来的结构有什么意义呢？关键在于学习，通过完成本教程的学习，您将：进一步了解 VGG 构架；进一步了解卷积神经网

09

卷积神经网络VGG16这么简单，为什么没人能说清？

很多人想入门做深度学习，但往往翻遍网络看完一篇又一篇所谓的“入门教程”，paper，包括很多深度学习框架官方给出的案例，给人的感觉真的是从入门到放弃。写教程的作者有很多都是技术大神，但写出的东西真的是把原本简简单单的理论说得晦涩难懂，模凌两可。比如说VGG16，都是摆上从论文里截过来的下面这张图：

01

深度学习与TensorFlow:VGG论文复现

上一篇文章我们介绍了下VGG这一个经典的深度学习模型,今天便让我们通过使用VGG开源的VGG16模型去复现一下该论文. 话不多说,直接上代码: 一:了解结构上述文件便是我们复现VGG时候的所有文件,

08

深度学习与TensorFlow:VGG论文复现

上一篇文章我们介绍了下VGG这一个经典的深度学习模型,今天便让我们通过使用VGG开源的VGG16模型去复现一下该论文.

04

深度学习与TensorFlow:VGG论文复现

上一篇文章我们介绍了下VGG这一个经典的深度学习模型,今天便让我们通过使用VGG开源的VGG16模型去复现一下该论文.

04

使用Keras进行深度学习(二): CNN讲解及实践

前言：现今最主流的处理图像数据的技术当属深度神经网络了，尤其是卷积神经网络CNN尤为出名。本文将通过讲解CNN的介绍以及使用keras搭建CNN常用模型LeNet-5实现对MNist数据集分类，从而使得读者更好的理解CNN。 1.CNN的介绍 CNN是一种自动化提取特征的机器学习模型。首先我们介绍CNN所用到一些基本结构单元： 1.1卷积层：在卷积层中，有一个重要的概念：权值共享。我们通过卷积核与输入进行卷积运算。通过下图可以理解如何进行卷积运算。卷积核从左到右对输入进行扫描，每次滑动1格（步长为1），

04

用网络摄像头制作艺术品

几千年来，人类文化的一个非常重要的特征就是艺术。没有其他物种能够创造出与Leo da Vinci或Van Gogh的画作有些相似的东西。甚至很多人都难以创造出这种品质的艺术品。直到最近，随着神经风格迁移的引入，能够采用图像的风格，然后将其应用于另一个图像的内容。这使得计算机能够创建如上图所示的图像，这是斯坦福大学胡佛塔的图片，由梵高的Starry Night风格化。在本文中将讨论神经风格迁移，然后讨论快速风格迁移。

01

硬货 | 手把手带你构建视频分类模型（附Python演练））

我们可以使用计算机视觉和深度学习做很多事情，例如检测图像中的对象，对这些对象进行分类，从电影海报中生成标签。

02

tensorflow实现从.ckpt文件中读取任意变量

看了faster rcnn的tensorflow代码，关于fix_variables的作用我不是很明白，所以写了以下代码，读取了预训练模型vgg16得fc6和fc7的参数，以及faster rcnn中heat_to_tail中的fc6和fc7，将它们做了对比，发现结果不一样，说明vgg16的fc6和fc7只是初始化了faster rcnn中heat_to_tail中的fc6和fc7，之后后者被训练。

02

关于深度学习系列笔记十三（使用预训练的卷积神经网络）

深度学习一个比较好的原则是使用专家学习得到的预训练网络模型，这里面包括几个概念，特征提取、微调模型、卷积基、卷积块等内容。

02

10个预训练模型开始你的深度学习（计算机视觉部分）

对于希望学习算法或尝试现有框架的人来说，预训练的模型是一个很好的帮助。由于时间限制或计算资源的限制，不可能总是从头构建模型，这就是为什么存在预训练模型！

02

基于 Keras 对深度学习模型进行微调的全面指南 Part 2

本部分属该两部系列中的第二部分，该系列涵盖了基于 Keras 对深度学习模型的微调。第一部分阐述微调背后的动机和原理，并简要介绍常用的做法和技巧。本部分将详细地指导如何在 Keras 中实现对流行模型 VGG，Inception 和 ResNet 的微调。

03

keras系列︱图像多分类训练与利用bottleneck features进行微调（三）

该文摘要总结：利用卷积神经网络来对图像进行特征提取和分类，使用预训练的VGG16网络作为基础网络，通过修改网络结构以适应自己的数据集，并使用合成数据集进行训练。在训练过程中，使用了数据增强技术，包括旋转、翻转和水平翻转等，以提高模型的性能。最终，该模型在测试集上获得了85.43%的准确率，表现良好。

08

「深度学习一遍过」必修10：pytorch 框架的使用

CenterCrop，ColorJitter，FiveCrop，Grayscale，Pad，RandomAffine，RandomApply， RandomCrop，RandomGrayscale， RandomHorizontalFlip，RandomPerspective，RandomResizedCrop，RandomRotation， RandomSizedCrop， RandomVerticalFlip， Resize，Scale，TenCrop，GaussianBlur，RandomChoice，RandomOrder， LinearTransformation，Normalize，RandomErasing，ConvertImageDtype， ToPILImage，ToTensor，Lambda

02

R语言基于Keras的小数据集深度学习图像分类

您有时会听到深度学习仅在有大量数据可用时才有效。这部分是有效的：深度学习的一个基本特征是它可以自己在训练数据中找到有趣的特征，而不需要手动特征工程，这只有在有大量训练样例可用时才能实现。对于输入样本非常高维的问题（如图像）尤其如此。

03

十大预训练模型，助力入门深度学习（第1部分 - 计算机视觉）

对于希望运用某个现有框架来解决自己的任务的人来说，预训练模型可以帮你快速实现这一点。通常来说，由于时间限制或硬件水平限制大家往往并不会从头开始构建并训练模型，这也就是预训练模型存在的意义。大家可以使用预训练模型作为基准来改进现有模型，或者针对它测试自己的模型：

04

目标检测系列之三（SSD）

论文题目是《Single Shot MultiBox Detector》论文地址：ttps://arxiv.org/abs/1512.02325 SSD是一阶段One Stage方法，SSD算法提取了不同尺度的特征图，既可以检测大目标也可以检测小目标，采用不同大小和长宽比的检测框anchors。算法步骤： 1）将图像输入预训练好的分类网络（基于VGG16-Atrous）得到不同大小的特征映射 2）分别提取Conv4_3、Conv7、Conv8_2、Conv9_2、Conv10_2、Conv11_2层的特征映射feature map，在每个特征映射的每个点构造6个不同大小尺度的bounding box，进行检测和分类来生成一些列bounding box 3）采用NMS处理不同特征映射的bounding box，删掉部分重叠或者不正确的bounding box，得到最终的检测框。

02

使用预先训练网络和特征抽取大力提升图像识别率

神经网络在项目实践中遇到的一大问题是数据不足。任何人工智能项目，在数据不足面前都会巧妇难为无米之炊，算法再精巧，只要数据量不足，最后的效果都不尽如人意，我们目前正在做的图像识别就是如此，要想让网络准确的识别猫狗图片，没有几万张图片以上是做不到的。

05

如何快速搭建智能人脸识别系统（附代码）

网络安全是现代社会最关心的问题之一，确保只有特定的人才能访问设备变得极其重要，这是我们的智能手机设有两级安全系统的主要原因之一。这是为了确保我们的隐私得到维护，只有真正的所有者才能访问他们的设备。基于人脸识别的智能人脸识别技术就是这样一种安全措施，本文我们将研究如何利用VGG-16的深度学习和迁移学习，构建我们自己的人脸识别系统。

01

如何快速搭建智能人脸识别系统

作者 | 小白来源 | 小白学视觉网络安全是现代社会最关心的问题之一，确保只有特定的人才能访问设备变得极其重要，这是我们的智能手机设有两级安全系统的主要原因之一。这是为了确保我们的隐私得到维护，只有真正的所有者才能访问他们的设备。基于人脸识别的智能人脸识别技术就是这样一种安全措施，本文我们将研究如何利用VGG-16的深度学习和迁移学习，构建我们自己的人脸识别系统。简介本项目构建的人脸识别模型将能够检测到授权所有者的人脸并拒绝任何其他人脸，如果面部被授予访问权限或访问被拒绝，模型将提供语音响应。用户

02

TensorFlow-VGG16模型复现

VGG全称是指牛津大学的Oxford Visual Geometry Group，该小组在2014年的ImageNet挑战赛中，设计的VGG神经网络模型在定位和分类跟踪比赛中分别取得了第一名和第二名的成绩。

01

Keras 手动搭建 VGG 卷积神经网络识别 ImageNet 1000 种常见分类

VGG 由牛津大学视觉几何组（Visual Geometry Group）开发。包含两个版本：VGG16 和 VGG19，分别有16个层级和19个层级。本文只介绍 VGG16 。根据 arxiv.org 上公布的论文，VGG 的卷积核大小为 (3, 3)，最大池化层核大小 (2, 2)，隐藏层激活函数为 ReLu, 输出层激活函数为 softmax。如果我们能知道模型各层的输入输出 shape 及层叠顺序，就能使用 Keras 自己搭建一个 VGG 。幸运的是，我们不需要从晦涩难懂的论文中提炼出模型的这些参数细节，Keras 可以直接给到我们这个模型全部细节。

02

语义分割（Semantic Segmentation）方法「建议收藏」

语义分割是当今计算机视觉领域的关键问题之一。从宏观上看，语义分割是一项高层次的任务，为实现场景的完整理解铺平了道路。场景理解作为一个核心的计算机视觉问题，其重要性在于越来越多的应用程序通过从图像中推断知识来提供营养。其中一些应用包括自动驾驶汽车、人机交互、虚拟现实等，近年来随着深度学习的普及，许多语义分割问题正在采用深层次的结构来解决，最常见的是卷积神经网络，在精度上大大超过了其他方法。以及效率。

02

语义分割最新算法_nonnegative integers

语义分割是当今计算机视觉领域的关键问题之一。从宏观上看，语义分割是一项高层次的任务，为实现场景的完整理解铺平了道路。场景理解作为一个核心的计算机视觉问题，其重要性在于越来越多的应用程序通过从图像中推断知识来提供营养。其中一些应用包括自动驾驶汽车、人机交互、虚拟现实等，近年来随着深度学习的普及，许多语义分割问题正在采用深层次的结构来解决，最常见的是卷积神经网络，在精度上大大超过了其他方法。以及效率。

03

浅谈深度学习训练中数据规范化(Normalization)的重要性

本文来自Oldpan博客:https://oldpan.me/archives/use-pytorch-normalization

03

深度学习500问——Chapter04：经典网络解读（2）

VGGNet是由牛津大学视觉几何小组（Visual Geometry Group，VGG）提出的一种深层卷积网络结构，它们以7.32%的错误率赢得了2014年ILSVRC分类任务的亚军（冠军由GoogLeNet以6.65%的错误率夺得）和25.32%的错误率夺得定位任务（Localization）的第一名（GooleNet错误率为26.44%）[5]，网络名称VGGNet取自该小组名缩写。VGGNet是首批把图像分类的错误率降低到10%以内模型，同时该网络所采用的3\times3卷积核的思想是后来许多模型的基础，该模型发表在2015年国际学习表征会议（International Conference On Learning Representations, ICLR）后至今被引用的次数已经超过1万4千余次。

01

Fast R-CNN

提出了一种基于区域卷积网络的快速目标检测方法(Fast R-CNN)。Fast R-CNN建立在以前工作的基础上，使用深度卷积网络有效地分类目标建议。与之前的工作相比，Fast R-CNN在提高训练和测试速度的同时，也提高了检测精度。Fast R-CNN训练了非常深的VGG16网络，速度比R-CNN快9倍，测试时速度213被，在PASCAL VOC 2012上实现了更高的mAP。与SPPnet相比，Fast R-CNN训练VGG16快三倍，测试速度快10倍，精度更高。

01

用python 6步搞定从照片到名画，你学你也可以（附视频）

近年来，机器学习的进步使我们仅用几行代码就能生成惊为天人的艺术作品。如果可以将艺术作品的原型设计速度提高100倍，让用户真正地与创作媒介合为一体，效果会怎么样呢？如果我们可以用机器学习的模式来扩展生物学习的模式，那么机器显然不是我们的艺术竞争对手，而是提高我们艺术创造力的途径。本期，Siraj将教大家通过在Keras中用TensorFlow后端编写Python脚本，把原图像变成任意艺术家的风格，从而实现风格迁移。【雷锋字幕组】招募进行时我们是一个由海内外优秀开发者组成的志愿者团队，致力于经典机器学习

05

Thermal Object Detection using Domain Adaptation through

最近发生的一起自动驾驶车辆致命事故引发了一场关于在自动驾驶传感器套件中使用红外技术以提高鲁棒目标检测可见性的辩论。与激光雷达、雷达和照相机相比，热成像具有探测红外光谱中物体发出的热差的优点。相比之下，激光雷达和相机捕捉在可见光谱，和不利的天气条件可以影响其准确性。热成像可以满足传统成像传感器对图像中目标检测的局限性。提出了一种用于热图像目标检测的区域自适应方法。我们探讨了领域适应的多种概念。首先，利用生成式对抗网络，通过风格一致性将低层特征从可见光谱域转移到红外光谱域。其次，通过转换训练好的可见光光谱模型，采用具有风格一致性的跨域模型进行红外光谱中的目标检测。提出的策略在公开可利用的热图像数据集(FLIR ADAS和KAIST多光谱)上进行评估。我们发现，通过域适应将源域的低层特征适应到目标域，平均平均精度提高了约10%。

01

Milvus开源向量搜索引擎，轻松搭建以图搜图系统

当您听到“以图搜图”时，是否首先想到了百度、Google 等搜索引擎的以图搜图功能呢？事实上，您完全可以搭建一个属于自己的以图搜图系统：自己建立图片库；自己选择一张图片到库中进行搜索，并得到与其相似的若干图片。 Milvus 作为一款针对海量特征向量的相似性检索引擎，旨在助力分析日益庞大的非结构化数据，挖掘其背后蕴含的巨大价值。为了让 Milvus 能够应用于相似图片检索的场景，我们基于 Milvus 和图片特征提取模型 VGG 设计了一个以图搜图系统。正文分为数据准备、系统概览、 VGG 模型、API 介绍、镜像构建、系统部署、界面展示七个部分。数据准备章节介绍以图搜图系统的数据支持情况。系统概览章节展示系统的整体架构。 VGG 模型章节介绍了 VGG 的结构、特点、块结构以及权重参数。 API 介绍章节介绍系统的五个基础功能 API 的工作原理。镜像构建章节介绍如何通过源代码构建客户端和服务器端的 docker 镜像。系统部署章节展示如何三步搭建系统。界面展示章节会展示系统的搜索界面。

07

【计算机视觉——RCNN目标检测系列】五、Fast R-CNN论文解读

又有一周没更新了，不知道进入研究生阶段写博客时间为什么这么上。上周四接到自己第一本书的三审意见需要进行修改。本想着慢慢修改的，结果上周五晚上接到通知北京印刷厂为迎国庆9月开始停业直至10月下旬。没办法必须为新书修改让路，像赶在8月末上式，虽然不知道能不能在8月末把书印出来。这也导致本应该周末整理完Fast R-CNN的笔记有拖了一周。

01

图像预训练模型的起源解说和使用示例

三十多年来，许多研究人员在图像识别算法和图像数据方面积累了丰富的知识。如果你对图像训练感兴趣但不知道从哪里开始，这篇文章会是一个很好的开始。这篇文章简要介绍了过去的演变，并总结了现在的一些热门话题。

05

使用迁移学习/数据增强方法来实现Kaggle分类&识别名人脸部

在这个项目中，我将使用keras、迁移学习和微调过的VGG16网络来对kaggle竞赛中的名人面部图像进行分类。

03

【Keras】Keras入门指南

在用了一段时间的Keras后感觉真的很爽，所以特意祭出此文与我们公众号的粉丝分享。 Keras是一个非常方便的深度学习框架，它以TensorFlow或Theano为后端。用它可以快速地搭建深度网络，灵活地选取训练参数来进行网路训练。总之就是：灵活+快速！

02

一文看懂迁移学习：怎样用预训练模型搞定深度学习？

瀚宸编译自 Analytics Vidhya 量子位出品 | 公众号 QbitAI 引言跟传统的监督式机器学习算法相比，深度神经网络目前最大的劣势是什么？贵。尤其是当我们在尝试处理现实生活中诸如图像识别、声音辨识等实际问题的时候。一旦你的模型中包含一些隐藏层时，增添多一层隐藏层将会花费巨大的计算资源。庆幸的是，有一种叫做“迁移学习”的方式，可以使我们在他人训练过的模型基础上进行小改动便可投入使用。在这篇文章中，我将会讲述如何使用预训练模型来加速解决问题的过程。注：这篇文章默认读者对于神经网络和

06

Keras预训练的ImageNet模型实现分类操作

本文主要介绍通过预训练的ImageNet模型实现图像分类，主要使用到的网络结构有：VGG16、InceptionV3、ResNet50、MobileNet。

02

[ I am Jarvis ] ：聊聊 FaceID 背后的深度学习视觉算法

本文介绍了计算机视觉领域中的经典算法及其在Tesla产品中的应用。这些算法包括HOG、SIFT、SURF、ORB、CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD、YOLO v2、ResNet、Inception、EfficientNet、Caffe、TensorFlow、Keras、OpenCV等，以及这些算法在自动驾驶、目标检测、人脸识别、图像分割、目标跟踪等应用场景中的实践案例。此外，作者还分享了在深度学习、计算机视觉领域中的代码、学习资料、开源项目、竞赛排名等方面的信息，供读者学习和参考。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭