前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【图像分割模型】全局特征与局部特征的交响曲—ParseNet

【图像分割模型】全局特征与局部特征的交响曲—ParseNet

作者头像
用户1508658
发布于 2019-07-28 06:18:48
发布于 2019-07-28 06:18:48
6500
举报
文章被收录于专栏:有三AI有三AI

1 理论感受野是真的吗?

相信通过前面几篇介绍上下文信息整合的文章,大家已经能够体会到感受野对于分割网络效果的影响有多么巨大了。简单来说,感受野越大,网络所能“看见”的区域就越大,从而能够用于分析的信息就更多。由此,分割的效果也很有可能更好。

基于这种考虑,许多算法尝试通过改变自身网络结构设计来增大网络的理论感受野,认为这样就能够为网络带来更多的信息。尽管理论感受野的增大的确能够增加网络所获取的上下文信息,但是,理论感受野难道真的就代表了算法实际看见的区域吗?

在实际应用中,许多方法的理论感受野是很大的。比如前面文章中介绍过的带VGG的FCN网络中的fc7层,其理论感受野为404x404像素。但是,实验却证明,其并没有办法看到这么大的区域。

比如,ParseNet的作者做了这样一个实验,即破坏图像中一个随机区域中的信息,以此来观察网络的输出结果是否依赖于这个区域。结果如下图所示:

从左到右分别为:图像、热度图、理论感受野和实际感受野。

由此可以看出,网络实际上能够覆盖的区域也就能达到整图的1/4左右,远远没有达到理论感受野的尺寸。那么究竟该如何利用全部的图像上下文信息呢?ParseNet提出了一种融合全局信息与局部信息的方法,下面来具体介绍一下。

2 全局特征的提取与融合

如下图所示,ParseNet通过全局池化提取图像的全局特征,并将其与局部特征融合起来。

这种融合在过程中需要考虑两个主要问题:融合的时机与尺度的归一化。

(1) 融合时机

直观上理解,全局特征与局部特征的融合可以发生在两个节点:分别是训练分类器之前(early fusion)和训练分类器之后(late fusion)。其中,前者是将两个特征融合后,作为一个整体共同送入分类网络,训练分类器;后者则是以两个特征为输入,分别训练其对应的分类器,最后再将分类的结果整合。

如果忽略结合特征后的训练过程,那么这两种融合的时机的鲜果是差不多的。但是,在某些情况下,只有全局特征辅助下的局部特征才能够判断出正确的分类结果;此时,如果两个特征分别训练再整合,那么这种情况下的分割损失是不可逆的,也就是说,这些情况下的分类将不正确。

当然,这两种方法在实际应用过程中是可以实现相似的结果的,但是late fusion需要进行归一化。

(2) 归一化

如下图所示,不同层之间的特征的尺度是不同的,而且这种不同可能很显著。(不同颜色代表不同层上的特征)

很显然,这些特征的尺度(scale)和范数(norm)是不同的。如果直接将这些特征级联起来会造成大特征控制小特征,使分割效果变差。尽管在训练过程中,网络的权重可能会对这种情况进行调整,但是这要求非常小心的调参和数据库选取。

因此,ParseNet利用了L2范数来归一化特征的融合过程。具体而言,给定d维输入x,算法通过计算其L2范数并在整个维度内实现归一化。

此外,如果只是单纯地对所有输入层进行归一化,不仅会减慢网络的训练速度,同时也会改变该层的尺度。因此,还需要对其增加一个尺度参数gamma,将归一化的结果进行尺度缩放(缩放结果为y)。

这一过程增加的参数量等于所有的通道数之和,因此在反向传播过程中是可以忽略的。具体的反向传播公式如下:

3 实验结果

下表是ParseNet在PASCAL VOC2012下的数据结果和与其他算法的比较:

其效果与DeepLab-LargeFOV相近。

下图是全局特征有助于分割结果的示例:

从左到右分别为:图像、真值、对比基准和ParseNet。

尽管总体而言,引入更多的上下文信息有助于分割。但是有时候,引入全局信息也可能给分类造成不好的影响,比如下图所示,从左到右分别是原图,真值,FCN以及ParseNet。

总结

本文我们了解了全局信息该如何使用、该注意什么问题。下篇文章我们来看看RefineNet中是如何用残差校正进一步提高分割效果的。今天的分享就是这样啦,下回见。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-05-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 有三AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
《ParseNet》论文阅读
这篇文章首先提出一个问题,理论感受野是真的吗?我们在前面讲过的PSPNet中已经知道,感受野对于语义分割网络有很大影响,我们也是尽量去增大网络的感受野,让网络可以看见的区域更多,从而让语义分割更加精确。然而论文首先摆出了一个质疑,理论感受野代表了算法的实际感受野吗?在实际应用中,很多网络的理论感受野是很大的。比如带VGG的FCN网络中的fc7层,其理论感受野为404*404像素。但是,事实上并没有办法看到这么大的区域,论文做了一个实验:
BBuf
2019/12/09
5600
FCN、ReSeg、U-Net、ParseNet、DeepMask…你都掌握了吗?一文总结图像分割必备经典模型(一)
 机器之心专栏 本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心公众号持续更新。 本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。 本文将分 3 期进行连载,共介绍 19 个在图像分割任务上曾取得 SOTA 的经典模型。 第 1 期:FCN、ReSeg、U-Net、ParseNet、DeepMask、S
机器之心
2023/05/01
1.3K0
FCN、ReSeg、U-Net、ParseNet、DeepMask…你都掌握了吗?一文总结图像分割必备经典模型(一)
【图像分割模型】多感受野的金字塔结构—PSPNet
从本系列前面的文章我们已经了解到,对于分割任务而言,上下文信息的利用情况对于分割的效果是有明显影响的。这里我们就具体谈谈这个影响的原因。
用户1508658
2019/07/28
1.6K0
【完结】12篇文章带你逛遍主流分割网络
专栏《图像分割模型》正式完结了。在本专栏中,我们从编解码结构入手,讲到解码器设计;从感受野,讲到多尺度融合;从CNN,讲到RNN与CRF;从2D分割,讲到3D分割;从语义分割到实例分割和全景分割。这篇文章我们就一起回顾一下这些网络结构。
小草AI
2019/06/28
5550
【完结】12篇文章带你逛遍主流分割网络
DeepLab、DeepLabv3、RefineNet、PSPNet…你都掌握了吗?一文总结图像分割必备经典模型(二)
 机器之心专栏 本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心公众号持续更新。 本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。 本文将分 3 期进行连载,共介绍 19 个在图像分割任务上曾取得 SOTA 的经典模型。 第 1 期:FCN、ReSeg、U-Net、ParseNet、DeepMask、S
机器之心
2023/05/16
1.4K0
DeepLab、DeepLabv3、RefineNet、PSPNet…你都掌握了吗?一文总结图像分割必备经典模型(二)
PPMamba 一种基于金字塔聚类局部辅助SSM的图像语义分割模型 !
遥感(RS)技术的快速发展极大地改变了作者对地球时间和空间尺度的认识。遥感技术在农业、林业、地质学、气象学、军事和环境保护等领域得到广泛应用,实现了系统性的分析、评估和预测。在这些应用中,语义分割在许多下游地质学任务中起着重要的作用,如土地覆盖分类和城市扩张监测等。
未来先知
2024/09/29
3710
PPMamba 一种基于金字塔聚类局部辅助SSM的图像语义分割模型 !
图像分割综述
这一大部分我们将要介绍的是深度学习大火之前人们利用数字图像处理、拓扑学、数学等方面的只是来进行图像分割的方法。当然现在随着算力的增加以及深度学习的不断发展,一些传统的分割方法在效果上已经不能与基于深度学习的分割方法相比较了,但是有些天才的思想还是非常值得我们去学习的。 1.基于阈值的分割方法 阈值法的基本思想是基于图像的灰度特征来计算一个或多个灰度阈值,并将图像中每个像素的灰度值与阈值作比较,最后将像素根据比较结果分到合适的类别中。因此,该方法最为关键的一步就是按照某个准则函数来求解最佳灰度阈值。 阈值法特别适用于目标和背景占据不同灰度级范围的图。 图像若只有目标和背景两大类,那么只需要选取一个阈值进行分割,此方法成为单阈值分割;但是如果图像中有多个目标需要提取,单一阈值的分割就会出现作物,在这种情况下就需要选取多个阈值将每个目标分隔开,这种分割方法相应的成为多阈值分割。
用户1150922
2019/07/10
2.1K0
PANet、DANet、FastFCN、OneFormer…你都掌握了吗?一文总结图像分割必备经典模型(三)
 机器之心专栏 本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心公众号持续更新。 本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。 本文将分 3 期进行连载,共介绍 19 个在图像分割任务上曾取得 SOTA 的经典模型。 第 1 期:FCN、ReSeg、U-Net、ParseNet、DeepMask、S
机器之心
2023/05/22
2.2K0
PANet、DANet、FastFCN、OneFormer…你都掌握了吗?一文总结图像分割必备经典模型(三)
CP-UNet:基于轮廓的医学超声图像分割概率模型 !
超声成像广泛应用于各种疾病的诊断,由于其低成本、简单操作和非侵入性,因此在医学超声图像的病变分割中,基于深度学习的分割方法得到了应用。然而,由于超声图像中存在不均匀的病变区域分布、斑点噪声和成像伪迹,这增加了分割任务的难度。如图1(b)(c)(d)所示的病变与正常组织之间的结构边界线模糊,以及如图1(e)(f)所示的病变形状和纹理的不规则变化,都导致了轮廓模糊。这些因素共同影响了分割的准确性。
未来先知
2024/12/23
3680
CP-UNet:基于轮廓的医学超声图像分割概率模型 !
【语义分割】一篇看完就懂的最新深度语义分割模型综述
语义分割结合了图像分类、目标检测和图像分割,通过一定的方法将图像分割成具有一定语义含义的区域块,并识别出每个区域块的语义类别,实现从底层到高层的语义推理过程,最终得到一幅具有逐像素语义标注的分割图像。
AI算法与图像处理
2020/02/24
16.5K0
【语义分割】一篇看完就懂的最新深度语义分割模型综述
语义分割技术综述_语义分割模型
综述论文翻译:A Review on Deep Learning Techniques Applied to Semantic Segmentation
全栈程序员站长
2022/09/25
1K0
语义分割技术综述_语义分割模型
全卷积网络:从图像级理解到像素级理解
卷积神经网络(CNN):图像级语义理解的利器 自2012年AlexNet提出并刷新了当年ImageNet物体分类竞赛的世界纪录以来,CNN在物体分类、人脸识别、图像检索等方面已经取得了令人瞩目的成就。通常CNN网络在卷积层之后会接上若干个全连接层, 将卷积层产生的特征图(feature map)映射成一个固定长度的特征向量。 以AlexNet为代表的经典CNN结构适合于图像级的分类和回归任务,因为它们最后都期望得到整个输入图像的一个数值描述, 比如AlexNet的ImageNet模型输出一个1000
智能算法
2018/04/02
2.2K0
全卷积网络:从图像级理解到像素级理解
CVPR2020 | SANet:视觉注意力SE模块的改进,并用于语义分割
论文地址:https://arxiv.org/pdf/1909.03402.pdf
AI算法修炼营
2020/06/24
5.4K0
北大、北理工、旷视联手:用于图像语义分割的金字塔注意力网络
翻译 | 林椿眄 出品 | 人工智能头条(公众号ID:AI_Thinker) 近日,北京理工大学、旷视科技、北京大学联手,发表了一篇名为 Pyramid Attention Network for Semantic Segmentation 的论文。在这篇论文中,四位研究者提出了一种金字塔注意力网络 (Pyramid Attention Network,PAN),利用图像全局的上下文信息来解决语义分割问题。 与大多数现有研究利用复杂的扩张卷积 (dilated convolution) 并人为地设计解码器网
用户1737318
2018/06/05
1.4K0
【CV】图像分割详解!
这一大部分我们将要介绍的是深度学习大火之前人们利用数字图像处理、拓扑学、数学等方面的只是来进行图像分割的方法。当然现在随着算力的增加以及深度学习的不断发展,一些传统的分割方法在效果上已经不能与基于深度学习的分割方法相比较了,但是有些天才的思想还是非常值得我们去学习的。
Twcat_tree
2023/10/25
5560
【CV】图像分割详解!
结合局部与全局特征的点云语义分割卷积网络
点云语义分割在许多与点云相关的应用程序中具有重要作用,特别是对于机载激光点云,精确的注释可大大扩展其在各种应用中的用途。然而,受限于传感器噪声、复杂的对象结构、不完整的点和不均匀的点密度,准确而有效的语义分割仍是一项艰巨的任务。因此,提出了一种结合局部与全局特征的机载激光点云语义分割网络。
一点人工一点智能
2023/04/26
8100
结合局部与全局特征的点云语义分割卷积网络
超越传统 UNet ,GCtx-UNet 结合全局与局部特征,实现高效图像分割 !
自动化医学图像分割在提供有价值信息以预防、诊断、进展监测和预测各种疾病以及定量病理学评估中至关重要。目前,包括编码器、解码器和跳跃连接在内的U形深度神经网络在医学图像分割中应用最为广泛。尽管U形网络在许多医学图像分割任务中取得了最先进的表现,但仍然存在局限性。一个主要的局限性是编码器在有效提取和整合长距离和局部特征方面的能力。
AIGC 先锋科技
2024/07/08
1.1K0
超越传统 UNet ,GCtx-UNet  结合全局与局部特征,实现高效图像分割 !
ECCV2020 | EfficientFCN:语义分割中的整体引导解码器,巧妙捕获上下文信息
论文地址:http://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123710001.pdf
AI算法修炼营
2020/08/25
1.1K0
ECCV2020 | EfficientFCN:语义分割中的整体引导解码器,巧妙捕获上下文信息
【AI有识境】如何掌握好图像分割算法?值得你看的技术综述
进入到有识境界,可以大胆地说自己是一个非常合格的深度学习算法工程师了,能够敏锐地把握自己研究的领域,跟踪前沿和能落地的技术,对自己暂时不熟悉的领域也能快速地触类旁通。
用户1508658
2021/06/08
1.3K0
与时代共振,AI助力工业缺陷检测
[ 摘要 ]由于深度学习强大的特征提取能力,代替了人工目检和传统的机器视觉,成为了工业缺陷检测的新利器。然而,基于深度学习的语义分割技术在工业缺陷检测领域的应用仍具有挑战性。本文先对比自然场景下的语义分割,概述了工业缺陷检测背景下语义分割技术的特点;接着,对于工业缺陷检测的常见难点,对常见的解决方案进行介绍。最后,作者提出了关于工业缺陷检测实际应用中一些问题的思考。
数据派THU
2021/10/19
1.1K0
推荐阅读
相关推荐
《ParseNet》论文阅读
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档