PSPNet – Pyramid Scene Parsing Network 核心模块是金字塔池化模块( pyramid pooling module),它能够聚合不同区域的上下文信息,从而提高获取全局信息的能力...论文中使用的4个等级,核大小分别为1×1,2×2,3×3,6×6 2.整体架构 在PSP模块的基础上,PSPNet的整体架构如下: CNN是经过预训练的模型(ResNet101)和空洞卷积策略
本次, 由香港中文大学(CUHK)和商汤科技(SenseTime)提出的金字塔场景解析网络(Pyramid Scene Parsing Network, PSPNet)已经过审阅。...场景解析 通过使用金字塔池化模块(Pyramid Pooling Module),在整合基于不同区域的上下文后,PSPNet在效果上超过了FCN、DeepLab和DilatedNet等时下最佳的方法。...ADE2K - ImageNet场景解析挑战赛2016 ADE2K测试集结果 PSPNet赢得了2016年ImageNet场景解析挑战赛冠军。 5.2....同样,PSPNet优于所有最先进的方法,如FCN、DeconvNet、DeepLab和Dilation8。 下面是一些例子: PASCAL VOC 2012样例 5.3....Cityscapes测试集结果 采用精细标注数据训练,或采用精细数据与粗略标注数据同时训练,PSPNet都取得了较好的效果。
通过使用金字塔池化模块(Pyramid Pooling Module),在整合基于不同区域的上下文后,PSPNet在效果上超过了FCN、DeepLab和DilatedNet等时下最佳的方法。...原标题 | Review: PSPNet — Winner in ILSVRC 2016 (Semantic Segmentation / Scene Parsing) 作者 | Sik-Ho Tsang...对全局信息的需要 (c) 原有的未经上下文整合的FCN,(d) 经上下文整合的PSPNet 关系错误匹配:FCN基于外观将黄色框内的船预测为“汽车”。...ADE2K - ImageNet场景解析挑战赛2016 ADE2K测试集结果 PSPNet赢得了2016年ImageNet场景解析挑战赛冠军。 5.2....Cityscapes测试集结果 采用精细标注数据训练,或采用精细数据与粗略标注数据同时训练,PSPNet都取得了较好的效果。
从左到右分别为:图像、真值、FCN结果和PSPNet结果。 除此之外,由于金字塔结构并行考虑了多个感受野下的目标特征,从而对于尺寸较大或尺寸过小的目标有更好的识别效果。 ?...从左到右分别为:图像、真值、FCN结果和PSPNet结果。 可见,同时考虑不同感受野下的上下文信息是十分必要的。下面我们就一起来具体看一下金字塔池化模型。...3 实验结果 为了验证金字塔结构的有效性,PSPNet的作者对其进行了一系列的剥离实验。具体结果如下表所示: ? ADE20K数据库下的分割结果: ?...总结 本文我们了解了上下文信息整合的多尺度估计网络PSPNet和其中的金字塔池化模型。除了同种特征的堆叠,我们还可以利用多特征融合提升分割的效果。下期我们就一起来看一下ParseNet。
下面我们对主流的模型进行介绍,包括FCN、SegNet、U-Net、PSPNet、DeepLab V1~V3等。...5.8 PSPNet PSPNet在论文 PSPNet: Pyramid Scene Parsing Network 中提出。...PSPNet利用基于不同区域的上下文信息集合,通过我们的金字塔池化模块,使用提出的金字塔场景解析网络(PSPNet)来发挥全局上下文信息的能力。...全局先验表征在场景解析任务中产生了良好的质量结果,而 PSPNet 为像素级的预测提供了一个更好的框架,该方法在不同的数据集上达到了最优性能。...RefineNet 解决了传统卷积网络中空间分辨率减少的问题,与 PSPNet(使用计算成本高的空洞卷积)使用的方法非常不同。
主要尝试的模型: 训练数据集s1s2 (pspnet-densenet-s1s2) 训练数据集s1s2-crf2 (pspnet-densenet-s1s2-crf2) 不同网络输入尺度 (pspnet-densenet-s1s2...-320) focal loss (pspnet-densenet-s1s2-crf2-fl) 类别加权训练 (pspnet-densenet-s1s2-crf2-weight) ?...-320,更改--image_rows 和 --img_cols 为320 在run_train.sh,除了pspnet-densenet-s1s2-crf2-fl调用 train-fl.py, 其它模型用...train.py 对于pspnet-densenet-s1s2-crf2-weight,更改train.py中的weights_per_class 为[0,1,1,3,3],默认[0,1,1,1,1].../submit.sh results/pspnet-densenet-s1s2-crf2/vote 1)
目前已经实现了包括PSPNet和PSANet在内的网络,其在2016年ImageNet场景解析挑战赛@ ECCV16,LSUN语义分割挑战赛2017 @ CVPR17和WAD可驾驶区域分割挑战赛2018...该库开发者即PSPNet和PSANet算法的一作。 亮点 1. 同时支持多线程训练与多进程训练,并且后者非常快(该库比较重视训练)。 2....作者推荐的软硬件环境: (要4到8块显卡,看来没有多卡,语义分割是玩不起了~) 训练简单 该库的训练非常简单,简单配置后只需要一条命令 sh tool/train.sh ade20k pspnet50...测试简单 简单配置数据集和模型路径后,也只需要一条命令: sh tool/test.sh ade20k pspnet50 在单幅图像上测试也很简单,示例: PYTHONPATH=..../ python tool/demo.py --config=config/ade20k/ade20k_pspnet50.yaml --image=figure/demo/ADE_val_00001515
ICNet是一个基于PSPNet的实时语义分割网络,设计目的是减少PSPNet推断时期的耗时,论文对PSPNet做了深入分析,在PSPNet的基础上引入级联特征融合模块,实现快速且高质量的分割模型。...关于PSPNet请看昨天的推文。 可以看到之前的许多分割的经典方法速度不快,而速度快的ENet的精度又不高,PSPNet在速度和精度找到了一个平衡点。...PSPNet给出了一个快速的语义分割的层次结构,利用级联图像作为输入加速推理,构建一个实时分割系统。 网络耗时分析 蓝色的分辨率为1024*2048,绿色的分辨率为512*512。...这里以1:8,1:16,1:32的比例测试PSPNet50,结果如下: 较小的特征图可以以牺牲准确度换取更快的推断,但就算使用1:32(132ms)依然达不到实时要求。...注意到全部分支的速度很快,并且性能接近PSPNet了,且能保持30fps。而且内存消耗也明显减少了。 结论 论文在PSPNet的基础上改进出一个ICNet。
Neural Architecture Search 语义分割 DeepLabV3: Rethinking Atrous Convolution for Semantic Image Segmentation PSPNet...datasets/seg/preprocess TorchCV 的命令 项目作者提供了命令行工具,供用户使用模型,代码如下: 训练 cd scripts/seg/cityscapes/ bash run_fs_pspnet_cityscapes_seg.sh...train tag 恢复训练 cd scripts/seg/cityscapes/ bash run_fs_pspnet_cityscapes_seg.sh train tag 验证 cd scripts.../seg/cityscapes/ bash run_fs_pspnet_cityscapes_seg.sh val tag 测试 cd scripts/seg/cityscapes/ bash run_fs_pspnet_cityscapes_seg.sh
9.8 PSPNet 场景解析对于无限制的开放词汇和不同场景来说是具有挑战性的。...本文使用文中的 pyramid pooling module 实现基于不同区域的上下文集成,提出了PSPNet,实现利用上下文信息的能力来进行场景解析。...作者认为,FCN存在的主要问题是没有采取合适的策略来用全局的信息,本文的做法就是借鉴SPPNet来设计了PSPNet解决这个问题。...本文的主要贡献如下: (1)提出了PSPNet在基于FCN的框架中集成困难的上下文特征。 (2)通过基于深度监督误差开发了针对ResNet的高效优化策略。...Encoder-Decoder:利用Decoder 阶段的多尺度特征,运用到Decoder阶段上恢复空间分辨率,代表工作有 FCN、SegNet、PSPNet等工作。
深度学习系列(五)分割网络模型(DeepLab V1、DeepLab V2、PSPNet、DeepLab V3、DeepLab V3+) 内容目录 1、Deeplab V12、DeepLab V23、PSPNet4...3、PSPNet 《Pyramid Scene Parsing Network》 https://arxiv.org/pdf/1612.01105.pdf 通过多尺度 Pooling 的方式得到不同 Scale...PSPNet在不同网格尺度上执行空间池化,并在多个语义分割数据集上获得出色的性能。 ? ?...多个分割网络的pytorch实现,如:Deeplabv3, Deeplabv3_plus, PSPNet, UNet, UNet_AutoEncoder, UNet_nested, R2AttUNet,
一些最新的方法如PSPNet,RefineNet,DeepLab和AcNet等以非常高的准确率执行语义分割任务。...此外,有更多有效的语义分割网络被提出,我们的工作基于ERF-PSPNet,这是一种为导航辅助系统设计的最新语义分割网络。...最后,我们用调整后的具有一定百分比的夜间图像的训练数据训练ERF-PSPNet,达到提高夜间语义分割模型性能的目的。...对于ERF-PSPNet,编码器部分在ImageNet上进行了预训练,所以ERF-PSPNet所有的训练任务都在解码器部分的训练中。第一种方法是在BDD10K上训练ERF-PSPNet。...在第二种方法中,使用BDD10K训练集中不同比例的图像来训练ERF-PSPNet。
由上图可以看出,比较出名的分割模型PSPNet和ResNet38模型,分割准确率高,但是效率不高,像实时性比较好的ENet分割效率高但是分割准确度还没有60%。...channels数目和图片尺寸对模型速度的影响 分析下面这张图,不同的分辨率图片输入PSPNet50网络,观察每一个阶段的计算时间,由此,我们可以看出,模型中每层的复杂度同输入图像的分辨率和模型的channel...ICNet模型 根据上面分析的影响模型复杂度的因素,我们设计了基于PSPNet模型的多分辨率输入ICNet模型,将图片按一定比例缩放为不同的尺寸,将最小尺度的图片输入复杂度最高的分割模型,将高分辨率图片输入低复杂度模型...模型特点 (1)channels数目和输入特征的尺度影响卷积层的复杂度 (2)模型存在三个分支,对应不同复杂度的模型以及不同尺度的输入图片 (3)一个完整的PSPNet模型,和两个分支优化分割结果 (4...下采样图片输入尺寸,送入PSPNet50模型,直接上采样至原始尺寸,结果粗糙,遗失了一些很小但是重要的细节。图中scale为图片下采样比例,可以看出,输入尺寸越小,模型准确度越低,但运行速度越快。
当下载结束,您将看到以下两个文件在您当前工作目录:pspnet_r50-d8_4xb2-40k_cityscapes-512x1024.py 和 pspnet_r50-d8_512x1024_40k_cityscapes...源码安装检验方式 cd mmsegmentation python demo/image_demo.py demo/demo.png \\ configs/pspnet/pspnet_r50-d8_4xb2...-40k_cityscapes-512x1024.py \\ pspnet_r50-d8_512x1024_40k_cityscapes_20200605_003338-2966598c.pth \\.../pspnet_r50-d8_4xb2-40k_cityscapes-512x1024.py : _base_ = [ '...../_base_/models/pspnet_r50-d8.py', '../_base_/datasets/cityscapes.py', '..
# Pyramid Scene Parsing Network [Project] [Code-Caffe] [Paper] [Slides] PSPNet 特点: * 场景标注 Scene...PSPNet: - PSPNet 来提取合适的全部特征 - 将传统 dilated FCN 产生的像素级特征,扩展到 global pyramid pooling 特征....网络结构 pyramid scene parsing network (PSPNet) 网络结构如 Figure3....PSPNet 特点: - 能够有效的得到像素级场景标注的全局上下文信息, pyramid pooling module 集合不同 levels 的信息,比 global pooling 具有更好的特征表示能力了
模型平台获取实现资源:https://sota.jiqizhixin.com/project/refinenet 4、 PSPNet PSPNet全称为Pyramid Scene Parseing...PSPNet通过对不同区域的上下文信息进行聚合,提升了网络利用全局上下文信息的能力。PSPNet使用的策略是:pooling-conv-upsample,拼接得到特征图后进行标签预测。...PSPNet的完整架构如图6所示。 图6 PSPNet概述。...PSPNet为四级模块,其二进制大小分别为1×1、2×2、3×3和6×6。...平台收录PSPNet共5个模型实现。 项目 SOTA!平台项目详情页 PSPNet 前往 SOTA!
如下例子是使用 PSPNet 训练并采用 OHEM 策略的配置: _base_ = '..../pspnet_r50-d8_512x1024_40k_cityscapes.py' model=dict( decode_head=dict( sampler=dict(type.../pspnet_r50-d8_512x1024_40k_cityscapes.py' model=dict( decode_head=dict( loss_decode=dict
从无到有) SegNet Vijay Badrinarayanan DeconvNet 2016 每个max_pooling的max索引 所有fc层 DeepLab FCN PSPNet...Mask-RCNN 2017 真正做到像素级 Image Segmentation(图像分割)族谱 FCN DeepLab DeconvNet SegNet PSPNet
From Github Issues of PSPNet PSPNet author’s answer for the training, the issues are mainly related...to do automatic calculation. other’s discussion [From Fromandto]: I am training a 713 resolution pspnet...However, the bn layer seems important to the performance of PSPNet.
领取专属 10元无门槛券
手把手带您无忧上云