首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

PSPNet | 语义分割及场景分析

本次, 由香港中文大学(CUHK)和商汤科技(SenseTime)提出的金字塔场景解析网络(Pyramid Scene Parsing Network, PSPNet)已经过审阅。...场景解析 通过使用金字塔池化模块(Pyramid Pooling Module),在整合基于不同区域的上下文后,PSPNet在效果上超过了FCN、DeepLab和DilatedNet等时下最佳的方法。...ADE2K - ImageNet场景解析挑战赛2016 ADE2K测试集结果 PSPNet赢得了2016年ImageNet场景解析挑战赛冠军。 5.2....同样,PSPNet优于所有最先进的方法,如FCN、DeconvNet、DeepLab和Dilation8。 下面是一些例子: PASCAL VOC 2012样例 5.3....Cityscapes测试集结果 采用精细标注数据训练,或采用精细数据与粗略标注数据同时训练,PSPNet都取得了较好的效果。

68310
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    PSPNet ——语义分割及场景分析

    通过使用金字塔池化模块(Pyramid Pooling Module),在整合基于不同区域的上下文后,PSPNet在效果上超过了FCN、DeepLab和DilatedNet等时下最佳的方法。...原标题 | Review: PSPNet — Winner in ILSVRC 2016 (Semantic Segmentation / Scene Parsing) 作者 | Sik-Ho Tsang...对全局信息的需要 (c) 原有的未经上下文整合的FCN,(d) 经上下文整合的PSPNet 关系错误匹配:FCN基于外观将黄色框内的船预测为“汽车”。...ADE2K - ImageNet场景解析挑战赛2016 ADE2K测试集结果 PSPNet赢得了2016年ImageNet场景解析挑战赛冠军。 5.2....Cityscapes测试集结果 采用精细标注数据训练,或采用精细数据与粗略标注数据同时训练,PSPNet都取得了较好的效果。

    3.8K20

    【图像分割模型】多感受野的金字塔结构—PSPNet

    从左到右分别为:图像、真值、FCN结果和PSPNet结果。 除此之外,由于金字塔结构并行考虑了多个感受野下的目标特征,从而对于尺寸较大或尺寸过小的目标有更好的识别效果。 ?...从左到右分别为:图像、真值、FCN结果和PSPNet结果。 可见,同时考虑不同感受野下的上下文信息是十分必要的。下面我们就一起来具体看一下金字塔池化模型。...3 实验结果 为了验证金字塔结构的有效性,PSPNet的作者对其进行了一系列的剥离实验。具体结果如下表所示: ? ADE20K数据库下的分割结果: ?...总结 本文我们了解了上下文信息整合的多尺度估计网络PSPNet和其中的金字塔池化模型。除了同种特征的堆叠,我们还可以利用多特征融合提升分割的效果。下期我们就一起来看一下ParseNet。

    1.5K20

    深度学习与CV教程(14) | 图像分割 (FCN,SegNet,U-Net,PSPNet,DeepLab,RefineNet)

    下面我们对主流的模型进行介绍,包括FCN、SegNet、U-Net、PSPNet、DeepLab V1~V3等。...5.8 PSPNet PSPNet在论文 PSPNet: Pyramid Scene Parsing Network 中提出。...PSPNet利用基于不同区域的上下文信息集合,通过我们的金字塔池化模块,使用提出的金字塔场景解析网络(PSPNet)来发挥全局上下文信息的能力。...全局先验表征在场景解析任务中产生了良好的质量结果,而 PSPNet 为像素级的预测提供了一个更好的框架,该方法在不同的数据集上达到了最优性能。...RefineNet 解决了传统卷积网络中空间分辨率减少的问题,与 PSPNet(使用计算成本高的空洞卷积)使用的方法非常不同。

    1.4K42

    PyTorch语义分割开源库semseg

    目前已经实现了包括PSPNet和PSANet在内的网络,其在2016年ImageNet场景解析挑战赛@ ECCV16,LSUN语义分割挑战赛2017 @ CVPR17和WAD可驾驶区域分割挑战赛2018...该库开发者即PSPNet和PSANet算法的一作。 亮点 1. 同时支持多线程训练与多进程训练,并且后者非常快(该库比较重视训练)。 2....作者推荐的软硬件环境: (要4到8块显卡,看来没有多卡,语义分割是玩不起了~) 训练简单 该库的训练非常简单,简单配置后只需要一条命令 sh tool/train.sh ade20k pspnet50...测试简单 简单配置数据集和模型路径后,也只需要一条命令: sh tool/test.sh ade20k pspnet50 在单幅图像上测试也很简单,示例: PYTHONPATH=..../ python tool/demo.py --config=config/ade20k/ade20k_pspnet50.yaml --image=figure/demo/ADE_val_00001515

    1.9K10

    《ICNet》论文阅读及源码实现

    ICNet是一个基于PSPNet的实时语义分割网络,设计目的是减少PSPNet推断时期的耗时,论文对PSPNet做了深入分析,在PSPNet的基础上引入级联特征融合模块,实现快速且高质量的分割模型。...关于PSPNet请看昨天的推文。 可以看到之前的许多分割的经典方法速度不快,而速度快的ENet的精度又不高,PSPNet在速度和精度找到了一个平衡点。...PSPNet给出了一个快速的语义分割的层次结构,利用级联图像作为输入加速推理,构建一个实时分割系统。 网络耗时分析 蓝色的分辨率为1024*2048,绿色的分辨率为512*512。...这里以1:8,1:16,1:32的比例测试PSPNet50,结果如下: 较小的特征图可以以牺牲准确度换取更快的推断,但就算使用1:32(132ms)依然达不到实时要求。...注意到全部分支的速度很快,并且性能接近PSPNet了,且能保持30fps。而且内存消耗也明显减少了。 结论 论文在PSPNet的基础上改进出一个ICNet。

    1.3K10

    深度学习500问——Chapter09:图像分割(3)

    9.8 PSPNet 场景解析对于无限制的开放词汇和不同场景来说是具有挑战性的。...本文使用文中的 pyramid pooling module 实现基于不同区域的上下文集成,提出了PSPNet,实现利用上下文信息的能力来进行场景解析。...作者认为,FCN存在的主要问题是没有采取合适的策略来用全局的信息,本文的做法就是借鉴SPPNet来设计了PSPNet解决这个问题。...本文的主要贡献如下: (1)提出了PSPNet在基于FCN的框架中集成困难的上下文特征。 (2)通过基于深度监督误差开发了针对ResNet的高效优化策略。...Encoder-Decoder:利用Decoder 阶段的多尺度特征,运用到Decoder阶段上恢复空间分辨率,代表工作有 FCN、SegNet、PSPNet等工作。

    6500

    夜间场景缺数据,如何进行语义分割?浙大提出基于GAN的高鲁棒夜间语义分割框架

    一些最新的方法如PSPNet,RefineNet,DeepLab和AcNet等以非常高的准确率执行语义分割任务。...此外,有更多有效的语义分割网络被提出,我们的工作基于ERF-PSPNet,这是一种为导航辅助系统设计的最新语义分割网络。...最后,我们用调整后的具有一定百分比的夜间图像的训练数据训练ERF-PSPNet,达到提高夜间语义分割模型性能的目的。...对于ERF-PSPNet,编码器部分在ImageNet上进行了预训练,所以ERF-PSPNet所有的训练任务都在解码器部分的训练中。第一种方法是在BDD10K上训练ERF-PSPNet。...在第二种方法中,使用BDD10K训练集中不同比例的图像来训练ERF-PSPNet

    1.7K30

    实时性分割的ICNet模型如何同时确保分割速度与准确度?

    由上图可以看出,比较出名的分割模型PSPNet和ResNet38模型,分割准确率高,但是效率不高,像实时性比较好的ENet分割效率高但是分割准确度还没有60%。...channels数目和图片尺寸对模型速度的影响 分析下面这张图,不同的分辨率图片输入PSPNet50网络,观察每一个阶段的计算时间,由此,我们可以看出,模型中每层的复杂度同输入图像的分辨率和模型的channel...ICNet模型 根据上面分析的影响模型复杂度的因素,我们设计了基于PSPNet模型的多分辨率输入ICNet模型,将图片按一定比例缩放为不同的尺寸,将最小尺度的图片输入复杂度最高的分割模型,将高分辨率图片输入低复杂度模型...模型特点 (1)channels数目和输入特征的尺度影响卷积层的复杂度 (2)模型存在三个分支,对应不同复杂度的模型以及不同尺度的输入图片 (3)一个完整的PSPNet模型,和两个分支优化分割结果 (4...下采样图片输入尺寸,送入PSPNet50模型,直接上采样至原始尺寸,结果粗糙,遗失了一些很小但是重要的细节。图中scale为图片下采样比例,可以看出,输入尺寸越小,模型准确度越低,但运行速度越快。

    1.3K20
    领券