开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

用于FCN型网络的转置卷积TensorFlow填充

FCN（Fully Convolutional Network）是一种常用于图像语义分割的深度学习网络模型。在FCN中，转置卷积（Transpose Convolution）被广泛应用于将低分辨率的特征图恢复到原始输入图像的尺寸。

转置卷积是一种反卷积操作，通过在输入特征图之间插入一些填充值来扩大特征图的尺寸。TensorFlow是一个流行的深度学习框架，提供了丰富的转置卷积函数和工具来支持FCN网络的构建和训练。

转置卷积的填充（Padding）是指在转置卷积操作中对输入特征图进行填充的方式。填充可以在转置卷积过程中保持特征图的尺寸，并且有助于提取更丰富的特征信息。在TensorFlow中，填充可以通过设置转置卷积函数的padding参数来实现。

TensorFlow提供了两种常用的填充方式：SAME和VALID。SAME填充方式会在输入特征图的周围添加适当数量的填充值，使得转置卷积后的特征图尺寸与输入特征图尺寸相同。VALID填充方式则不进行填充，转置卷积后的特征图尺寸会缩小。

对于FCN型网络，填充方式的选择通常取决于应用场景和网络设计需求。如果需要保持特征图尺寸不变，可以选择SAME填充方式；如果可以接受特征图尺寸缩小，可以选择VALID填充方式。

在TensorFlow中，可以使用tf.nn.conv2d_transpose函数来实现转置卷积操作，并通过设置padding参数来指定填充方式。具体使用方法和示例可以参考腾讯云的TensorFlow产品文档：TensorFlow产品文档。

总结起来，FCN型网络中的转置卷积在图像语义分割等任务中起到重要作用，通过填充方式可以控制特征图的尺寸变化，TensorFlow提供了丰富的函数和工具来支持转置卷积操作的实现。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

语义分割和转置卷积

分割对图像分析是必不可少的。语义分割描述了每个像素与类别标记的关联过程，（例如：花朵、人物、道路、天空、海洋、或者汽车）。

02

基准评测 TensorFlow、Caffe、CNTK、MXNet、Torch 在三类流行深度神经网络上的表现（论文）

【新智元导读】新年伊始，新智元向你推荐香港浸会大学计算机学院褚晓文团队最新论文《基准评测当前最先进的深度学习软件工具》，评测了 Caffe、CNTK、MXNet、TensorFlow、Torch 这五个最受欢迎的DL框架在 FCN、CNN、RNN 上的表现。这是伯克利RISE实验室大牛、RISC之父 David Patterson 也在关注的深度学习库评测。论文作者强调这是一个开源项目，所有配置文件和实验数据均在 http: //www.comp.hkbu.edu.hk/∼chxw/dlbench.html

08

学界丨基准测评当前最先进的 5 大深度学习开源框架

AI 科技评论按：本文转自微信公众号医AI (med-ai)，来源：arXiv.org，论文作者：Shaohuai Shi, Qiang Wang, Pengfei Xu, Xiaowen Chu，译者：吴博, Elaine, Melody 在 2016 年推出深度学习工具评测的褚晓文团队，赶在猴年最后一天，在 arXiv.org 上发布了最新的评测版本。这份评测的初版，通过国内AI自媒体的传播，在国内业界影响很大。在学术界，其反响更是非同一般。褚晓文教授在1月5日的朋友圈说David Patterso

05

目标分割技术-语义分割总览

目标分割是计算机视觉领域的一个重要任务，旨在从图像或视频中准确地分割出特定的目标或对象。与目标检测关注物体位置和边界框不同，目标分割要求精确地识别并标记目标的每个像素，实现对目标的像素级别理解。

04

教程 | 重新发现语义分割，一文简述全卷积网络

语义分割是一种学习如何识别图像中对象范围的机器学习技术。语义分割赋予机器学习系统与人类相似的理解图像内容的能力。它促使机器学习算法定位对象的精准边界，无论是街景图像中的汽车和行人，还是医疗图像中的心脏、肝脏和肾脏。

02

举世瞩目的「深度神经网络」如何应用于移动端？

随着深度学习算法在图像领域中的成功运用，学术界的目光重新回到神经网络上；而随着 AlphaGo 在围棋领域制造的大新闻，全科技界的目光都聚焦在“深度学习”、“神经网络”这些关键词上。与大众的印象不完全一致的是，神经网络算法并不算是十分高深晦涩的算法；相对于机器学习中某一些数学味很强的算法来说，神经网络算法甚至可以算得上是“简单粗暴”。只是，在神经网络的训练过程中，以及算法的实际运用中，存在着许多困难，和一些经验，这些经验是比较有技巧性的。有道云笔记不久前更新的文档扫描功能中使用了神经网络算法。本文试图以文

08

使用深度学习来理解道路场景

语义分割是深度学习的方法之一，通过语义分割，我们可以对图片中的每一个像素赋予含义，即将像素划分到一个预先设定的类中。从上边的 GIF 图可以看出，我们在语义切分的过程中将像素分为两类（分别是道路和非道路），其中我们将识别为道路的部分标上了颜色。

02

语义分割最新算法_nonnegative integers

语义分割是当今计算机视觉领域的关键问题之一。从宏观上看，语义分割是一项高层次的任务，为实现场景的完整理解铺平了道路。场景理解作为一个核心的计算机视觉问题，其重要性在于越来越多的应用程序通过从图像中推断知识来提供营养。其中一些应用包括自动驾驶汽车、人机交互、虚拟现实等，近年来随着深度学习的普及，许多语义分割问题正在采用深层次的结构来解决，最常见的是卷积神经网络，在精度上大大超过了其他方法。以及效率。

03

语义分割（Semantic Segmentation）方法「建议收藏」

语义分割是当今计算机视觉领域的关键问题之一。从宏观上看，语义分割是一项高层次的任务，为实现场景的完整理解铺平了道路。场景理解作为一个核心的计算机视觉问题，其重要性在于越来越多的应用程序通过从图像中推断知识来提供营养。其中一些应用包括自动驾驶汽车、人机交互、虚拟现实等，近年来随着深度学习的普及，许多语义分割问题正在采用深层次的结构来解决，最常见的是卷积神经网络，在精度上大大超过了其他方法。以及效率。

02

理解卷积神经网络中的四种卷积

卷积现在可能是深度学习中最重要的概念。正是靠着卷积和卷积神经网络，深度学习才超越了几乎其他所有的机器学习手段。这期我们一起学习下深度学习中常见的卷积有哪些？

05

CNN中常用的四种卷积详解

卷积现在可能是深度学习中最重要的概念。正是靠着卷积和卷积神经网络，深度学习才超越了几乎其他所有的机器学习手段。这期我们一起学习下深度学习中常见的卷积有哪些？

02

三个优秀的语义分割框架 PyTorch实现

本文基于动手深度学习项目讲解了FCN进行自然图像语义分割的流程，并对U-Net和Deeplab网络进行了实验，在Github和谷歌网盘上开源了代码和预训练模型，训练和预测的脚本已经做好封装，读者可以自行下载使用。

02

【他山之石】三个优秀的PyTorch实现语义分割框架

使用的VOC数据集链接开放在文章中，预训练模型已上传Github，环境我使用Colab pro，大家下载模型做预测即可。

03

学界 | 新型实时形义分割网络ShuffleSeg：可用于嵌入式设备

选自arXiv 作者：Mostafa Gamal等机器之心编译参与：Panda 表现优良的卷积神经网络往往需要大量计算，这在移动和嵌入式设备以及实时应用上是一个很不利的因素。近日，开罗大学和阿尔伯塔大学的研究者提出了一种能实现实时形义分割的框架 ShuffleSeg。这种方法能在保证分割准确度的同时显著降低对计算资源的需求。机器之心在本文中对该项目进行了简要编译介绍，相关研究的 TensorFlow 代码已发布在 GitHub 上。论文地址：https://arxiv.org/abs/1803.038

08

基于 TensorFlow 在手机端实现文档检测

手机端运行卷积神经网络的一次实践 — 基于 TensorFlow 和 OpenCV 实现文档检测功能 1. 前言本文不是神经网络或机器学习的入门教学，而是通过一个真实的产品案例，展示了在手机客户端上运行一个神经网络的关键技术点在卷积神经网络适用的领域里，已经出现了一些很经典的图像分类网络，比如 VGG16/VGG19，Inception v1-v4 Net，ResNet 等，这些分类网络通常又都可以作为其他算法中的基础网络结构，尤其是 VGG 网络，被很多其他的算法借鉴，本文也会使用 VGG16 的基础

04

DL | 语义分割原理与CNN架构变迁

图像分割是根据图像内容对指定区域进行标记的计算机视觉任务。本文聚焦于语义分割任务，即在分割图中将同一类别的不同实例视为同一对象。作者将沿着该领域的研究脉络，说明如何用卷积神经网络处理语义图像分割的任务。

03

Task 7 FCN_3

为了更好更高效地进行数据分析，我学习了如何使用tf.summary观察训练过程，用tf.records制作和读取训练集，以及用tf.dataset按批读取数据。

04

在TensorFlow 2中实现完全卷积网络（FCN）

卷积神经网络（CNN）非常适合计算机视觉任务。使用对大型图像集（如ImageNet，COCO等）进行训练的预训练模型，可以快速使这些体系结构专业化，以适合独特数据集。此过程称为迁移学习。但是有一个陷阱！用于图像分类和对象检测任务的预训练模型通常在固定的输入图像尺寸上训练。这些通常从224x224x3到某个范围变化，512x512x3并且大多数具有1的长宽比，即图像的宽度和高度相等。如果它们不相等，则将图像调整为相等的高度和宽度。

03

转置卷积详解

前面文章对卷积做了讲解，感觉既然重新整理，就将系列概念整体做个梳理，也算是将自己知道的所有东西拿来献丑把。转置卷积(Transposed Convolution)是后来的叫法，一开始大家都是称逆卷积/反卷积(Deconvolution)，这个概念是在图像分割任务中被提出来的，图像分割需要逐像素的操作，对每一个像素做一个分割，将其归类到不同的物体当中。这个任务大家很自然的想要使用卷积神经网络来完成，那就得先使用卷积神经网络提取特征，但是卷积神经网络中的两大主要构件，卷积层和下采样层会使得图像的尺寸不断缩小。这个就与逐像素的分类不符，因为逐像素分割的话是需要输出和输入大小是一致的。针对这个问题，有人提出了先使用卷积核下采样层逐层的提取特征，然后通过上采样再将特征图逐渐的恢复到原图的尺寸。而这个上采样一开始就是通过反卷积来实现的。如果说卷积核下采样的过程特征图是变小的，那么上采样之后特征图应该变大。我们应该熟悉卷积的输出尺寸公式 o u t = ( F − K + 2 P ) / s + 1 out=(F-K+2P)/s+1 out=(F−K+2P)/s+1，其中F表示输入特征图的尺寸，K表示卷积核的尺寸，P表示padding，S表示卷积的步长。我们都通过这个公式来计算卷积的输出特征图尺寸。举例来说明，一个4×4的输入特征图，卷积核为3×3，如果不使用paddng，步长为1，则带入计算 o u t = ( 4 − 3 ) / 1 + 1 out=(4-3)/1+1 out=(4−3)/1+1为2。我们已经在im2col算法的介绍中讲解了卷积的实现，实际上这个步骤是通过两个矩阵的乘法来完成的，我们不妨记为 y = C x y=Cx y=Cx，如果要上采样，我们希望给输出特征图乘一个参数矩阵，然后把尺寸还原回去，根据数学知识，我们给特征图矩阵 y y y左乘一个{C^T}，就能得到 C T y = C T C x C^Ty=C^TCx CTy=CTCx， C C C的列数等于 x x x的行数， C T C C^TC CTC的行数和列数都等于x的行数，乘完之后，得到的结果与 x x x形状相同。这就是转置卷积名字的来源。有一些工作确实是这样实现的。我们也能很自然的得出结论，我们不需要给输出特征图左乘 C T C^T CT，显然只要和这个矩阵形状相同，输出的结果就和原特征图尺寸相同，而且这个操作同样可以使用卷积来实现，那我们只要保证形状一致，然后参数我们可以自己训练，这样尺寸的问题解决了，而且特征的对应也有了，是可以训练的，一举两得。 im2col讲解的内容，卷积是 ( C o u t , C i n ∗ K h ∗ K w ) (C_{out},C_{in}*K_h*K_w) (Cout,Cin∗Kh∗Kw)的卷积核乘 ( C i n ∗ K h ∗ K w , H N ∗ W N ) (C_{in}*K_h*K_w,H_N*W_N) (Cin∗Kh∗Kw,HN∗WN)的特征图，得到 ( C o u t , H N ∗ W N ) (C_{out},H_N*W_N) (Cout,HN∗WN)的结果。现在对卷积核做一个转置 ( C i n ∗ K h ∗ K w , C o u t ) (C_{in}*K_h*K_w,C_{out}) (Cin∗Kh∗Kw,Cout)乘 ( C o u t , H N ∗ W N ) (C_{out},H_N*W_N) (Cout,HN∗WN)得到一个 ( C i n ∗ K h ∗ K w , H N ∗ W N ) (C_{in}*K_h*K_w,H_N*W_N) (Cin∗Kh∗Kw,HN∗WN)的特征图。除了以上内容这里还有一点其他需要补充的东西，比如在caffe中除了im2col函数之外，还有一个函数是col2im，也就是im2col的逆运算。所以对于上面的结果caffe是通过col2im来转换成特征图的。但是col2im函数对于im2col只是形状上的逆函数，事实上，如果对于一个特征图先执行im2col再执行col2im得到的结果和原来是不相等的。而在tensorflow和pytorch中，这一点是有差异的，两者是基于特征图膨胀实现的转置卷积操作，两者是是通过填充来进行特征图膨胀的，之后可能还会有一个crop操作。之所以需要填充，是因为想要直接通过卷积操作来实现转置卷积，干脆填充一些值，这样卷积出来的特征图尺寸自然就更大。但是两者从运算上来讲都无法对原卷积进行复原，只是进行了形状复原而已。到了最后就可以讨论形状的计算了，转置卷积是卷积的形状逆操作，所以形状计算就是原来计算方式的逆函数。 o u t = ( F − K + 2 P ) / s + 1 out

02

《机器学习实战：基于Scikit-Learn、Keras和TensorFlow》第14章使用卷积神经网络实现深度计算机视觉

卷积神经网络（CNN）起源于人们对大脑视神经的研究，自从1980年代，CNN就被用于图像识别了。最近几年，得益于算力提高、训练数据大增，以及第11章中介绍过的训练深度网络的技巧，CNN在一些非常复杂的视觉任务上取得了超出人类表现的进步。CNN支撑了图片搜索、无人驾驶汽车、自动视频分类，等等。另外，CNN也不再限于视觉，比如：语音识别和自然语言处理，但这一章只介绍视觉应用。

04

如何理解深度学习中的deconvolution networks？

谭旭 https://www.zhihu.com/question/43609045/answer/132235276

01

详述Deep Learning中的各种卷积（二）

对于很多生成模型（如GAN中的生成器、自动编码器（Autoencoder）、语义分割等模型）。我们通常希望进行与正常卷积相反的装换，即我们希望执行上采样，比如自动编码器或者语义分割。（对于语义分割，首先用编码器提取特征图，然后用解码器回复原始图像大小，这样来分类原始图像的每个像素。）

02

fcn全卷积神经网络搭建_区域卷积神经网络

全卷积网络（Fully Convolutional Networks，FCN）是Jonathan Long等人于2015年在Fully Convolutional Networks for Semantic Segmentation一文中提出的用于图像语义分割的一种框架，是深度学习用于语义分割领域的开山之作。FCN将传统CNN后面的全连接层换成了卷积层，这样网络的输出将是热力图而非类别；同时，为解决卷积和池化导致图像尺寸的变小，使用上采样方式对图像尺寸进行恢复。

04

基于深度学习的图像语义分割算法综述

本文翻译自An overview of semantic image segmentation，原作者保留版权。

04

深度 | 图像语义分割的工作原理和CNN架构变迁

更具体地讲，语义图像分割的目标在于标记图片中每一个像素，并将每一个像素与其表示的类别对应起来。因为会预测图像中的每一个像素，所以一般将这样的任务称为密集预测。

00

深度 | 图像语义分割的工作原理和CNN架构变迁

更具体地讲，语义图像分割的目标在于标记图片中每一个像素，并将每一个像素与其表示的类别对应起来。因为会预测图像中的每一个像素，所以一般将这样的任务称为密集预测。

01

由浅入深CNN中卷积层与转置卷积层的关系

导语：转置卷积层（Transpose Convolution Layer）又称反卷积层或分数卷积层，在最近提出的卷积神经网络中越来越常见了，特别是在对抗生成神经网络（GAN）中，生成器网络中上采样部分就出现了转置卷积层，用于恢复减少的维数。那么，转置卷积层和正卷积层的关系和区别是什么呢，转置卷积层实现过程又是什么样的呢，笔者根据最近的预研项目总结出本文。

深入理解深度学习分割网络Ｕnet——U-Net: Convolutional Networks for Biomedical Image Segmentation

3. FCN采取解决方法是将pool4、pool3、和特征map融合起来，由于pool3、pool4、特征map大小尺寸是不一样的，所以融合应该前上采样到同一尺寸。这里的融合是拼接在一起，不是对应元素相加。

02

轻松理解转置卷积(transposed convolution)或反卷积(deconvolution)「建议收藏」

在CNN中,转置卷积是一种上采样(up-sampling)的常见方法.如果你不清楚转置卷积是怎么操作的,那么就来读读这篇文章吧.

01

专栏 | 手机端运行卷积神经网络实践：基于TensorFlow和OpenCV实现文档检测功能

机器之心投稿作者：腾讯 iOS 客户端高级工程师冯牮本文作者通过一个真实的产品案例，展示了在手机客户端上运行一个神经网络的关键技术点。前言本文不是神经网络或机器学习的入门教学，而是通过一个真实的产品案例，展示了在手机客户端上运行一个神经网络的关键技术点。在卷积神经网络适用的领域里，已经出现了一些很经典的图像分类网络，比如 VGG16/VGG19，Inception v1-v4 Net，ResNet 等，这些分类网络通常又都可以作为其他算法中的基础网络结构，尤其是 VGG 网络，被很多其他的算法借鉴

05

【技术】使用Tensorflow对象检测接口进行像素级分类

AiTechYun 编辑：yuxiangyu 在过去，我们使用Tensorflow对象检测API来实现对象检测，它的输出是图像中我们想要检测的不同对象周围的边界框。而Tensorflow最近添加了新功

04

FCN 的简单实现

学习了沐神的 gluon 课程，觉得里面有关于 fcn 的课程（http://t.cn/RQI7iD7 ）特别有用，于是总结一下，同时使用 pytorch 重新实现，不仅实现 gluon 教程中的部分，同时实现论文中更精细的形式。

04

Caffe实现上采样（upsample）方法总结

CNN的下采样（subsample）在几乎所有的模型结构中都会出现，比如stride>1的卷积操作，pooling操作，都会减少特征图的长宽，起到下采样的效果。与之相对的就是上采样（upsample）操作了，顾名思义，上采样在CNN模型中的作用上增大特征图的长宽，比如都变为原来的2倍。上采样在模型构建中并不像下采样那么频繁被使用，一般情况下，会在下面几个应用中用到上采样操作： 1.segmetation网络，因为segmentation需要还原到特征图到原始输入图像的尺寸； 2.图像生成任务，比如GAN，AVE等，也需要还原到原始输入图像的尺寸； 3.CNN可视化，通过反卷积将卷积得到的feature map还原到像素空间，来观察feature map对哪些pattern相应最大，即可视化哪些特征是卷积操作提取出来的；那么在Caffe中，都有哪些上采样操作呢？

02

FCN 的简单实现

学习了沐神的 gluon 课程，觉得里面有关于 fcn 的课程（http://t.cn/RQI7iD7 ）特别有用，于是总结一下，同时使用 pytorch 重新实现，不仅实现 gluon 教程中的部

07

深度学习中的12种卷积网络，万字长文一文看尽

深度学习中的各种卷积网络大家知多少？对于那些听说过却又对它们没有特别清晰的认识的小伙伴们，Kunlun Bai 这篇文章非常值得一读。Kunlun Bai 是一位人工智能、机器学习、物体学以及工程学领域的研究型科学家，在本文中，他详细地介绍了 2D、3D、1x1 、转置、空洞（扩张）、空间可分离、深度可分离、扁平化、分组等十二种卷积网络类型。

02

基于深度学习的图像语义分割算法综述

本文翻译自An overview of semantic image segmentation，原作者保留版权。

02

深度学习中的反卷积(Transposed Convolution)

反卷积(Transposed Convolution)是一种图像上采样(UpSample)的方法，在DCGAN中用它来将随机采样的值转换为一张完整的图像。

02

图像语义分割入门：FCN/U-Net网络解析

而截止目前，CNN已经在图像分类分方面取得了巨大的成就，涌现出如VGG和Resnet等网络结构，并在ImageNet中取得了好成绩。CNN的强大之处在于它的多层结构能自动学习特征，并且可以学习到多个层次的特征：

02

万字长文带你看尽深度学习中的各种卷积网络

AI 科技评论按：深度学习中的各种卷积网络大家知多少？对于那些听说过却又对它们没有特别清晰的认识的小伙伴们，Kunlun Bai 这篇文章非常值得一读。Kunlun Bai 是一位人工智能、机器学习、物体学以及工程学领域的研究型科学家，在本文中，他详细地介绍了 2D、3D、1x1 、转置、空洞（扩张）、空间可分离、深度可分离、扁平化、分组等十多种卷积网络类型。AI 科技评论编译如下。

01

万字长文带你看尽深度学习中的各种卷积网络

AI 科技评论按：深度学习中的各种卷积网络大家知多少？对于那些听说过却又对它们没有特别清晰的认识的小伙伴们，Kunlun Bai 这篇文章非常值得一读。Kunlun Bai 是一位人工智能、机器学习、物体学以及工程学领域的研究型科学家，在本文中，他详细地介绍了 2D、3D、1x1 、转置、空洞（扩张）、空间可分离、深度可分离、扁平化、分组等十多种卷积网络类型。AI 科技评论编译如下。

03

PyTorch中的模型创建

可以用 torchsummary 查看网络结构，如果没有的话，使用pip命令进行安装

00

深度学习论文笔记（七）---Deconvolution network-2016年（Learning Deconvolution Network for Semantic Segmentation ）

本文介绍了一种用于图像分割的深度卷积网络，通过学习输入图像的像素级标签，来自动构建一个图像分割的模型。该模型采用卷积神经网络作为特征提取器，并通过反卷积操作来将特征图扩展到原始图像大小，以生成像素级别的分类结果。实验结果表明，该方法在分割精度和计算效率方面都取得了较好的效果。

00

FCN重写笔记

参考tf.expand_dims和tf.squeeze函数另外，当指定了squeeze_dims时，对应维度大小必须为1

02

《Fully Convolutional Networks for Semantic Segmentation》论文阅读

这篇论文是拿到了CVPR2015 best paper候选的，在图像分割领域是一篇开山力作。

02

卷积神经网络CNN（1）——图像卷积与反卷积（后卷积，转置卷积）

传统的CNN网络只能给出图像的LABLE，但是在很多情况下需要对识别的物体进行分割实现end to end，然后FCN出现了，给物体分割提供了一个非常重要的解决思路，其核心就是卷积与反卷积，所以这里就详细解释卷积与反卷积。

03

那些一键抠图的软件是怎么做到的？这些语义分割方法了解一下

在深度学习时代到来之前，大量的图像处理技术被用来将图像分割成一些感兴趣的区域（ROI）。下面列出了一些常用的方法。灰度分割这是最简单的语义分割形式，它包括将一个区硬编码的规则或某个区域必须满足的特定的标签属性赋予这个区域。可以根据像素的属性（如灰度值）来构建这样的规则。「分裂-合并」算法就是一种用到了灰度分割技术的方法。该算法递归地将图像划分成若干子区域，直到可以为划分出的子区域分配一个标签，然后通过合并将相邻的带有相同标签的子区域融合起来。该方法存在的问题是，规则必须是硬编码的。此外，仅使用灰度信息来表示复杂的类（比如人）是极其困难的。因此，需要特征提取和优化技术来恰当地学习这些复杂类所需的表征形式。

04

一文搞懂反卷积，转置卷积

本文翻译自《Up-sampling with Transposed Convolution》，这篇文章对转置卷积和反卷积有着很好的解释，这里将其翻译为中文，以飨国人。如有谬误，请联系指正。转载请注明出处。

02

深度学习与CV教程(14) | 图像分割 (FCN,SegNet,U-Net,PSPNet,DeepLab,RefineNet)

本系列为斯坦福CS231n 《深度学习与计算机视觉(Deep Learning for Computer Vision)》的全套学习笔记，对应的课程视频可以在这里查看。更多资料获取方式见文末。

04

基于深度学习的语义分割技术总览

用卷积神经网络分类（全卷积网络FCN），与普通CNN网络不通的是，FCN的分类层是卷积层，普通网络为全连接层。方法介绍如下：最近的语义分割架构一般都用卷积神经网络（CNN）为每个像素分配一个初始类别标签。卷积层可以有效地捕捉图像中的局部特征，并以层级的方式将许多这样的模块嵌套在一起，这样 CNN 就可以试着提取更大的结构了。通过一系列卷积捕捉图像的复杂特征，CNN 可以将一张图的内容编码为紧凑表征。但为了将单独的像素映射给标签，我们需要将标准 CNN 编码器扩展为编码器-解码器架构。在这个架构中，编码器使用卷积层和池化层将特征图尺寸缩小，使其成为更低维的表征。解码器接收到这一表征，用通过转置卷积执行上采样而「恢复」空间维度，这样每一个转置卷积都能扩展特征图尺寸。在某些情况下，编码器的中间步骤可用于调优解码器。最终，解码器生成一个表示原始图像标签的数组。

02

用 TensorFlow 实现物体检测的像素级分类

雷锋网 AI 科技评论按：本文作者 Priyanka Kochhar 从事数据科学十多年，现在在运营一家深度学习咨询公司，她曾帮助多家创业公司完成人工智能解决方案的计划和部署，如果有兴趣与她合作，请联系 priya.toronto3@gmail.com。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭