Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >东北师范大学提出新的基于分层输入梯度网络的深度学习去噪方法

东北师范大学提出新的基于分层输入梯度网络的深度学习去噪方法

作者头像
CV君
发布于 2022-11-28 09:20:08
发布于 2022-11-28 09:20:08
4140
举报

图像处理中,图像的高频区域(边缘、纹理等)直接影响着结果的视觉感官质量。本文工作重新思考了图像梯度在深度学习网络中的构建,从像素级对噪声图像进行分层,为网络输入提供更多的结构信息,并通过反向传播梯度引导网络学习高频特征。最后提出了即插即用的锐化损失解决去噪图像过于平滑的问题,突出图像中的高频信息而不影响低频信息。在模拟噪声和真实噪声数据benchmark数据集上实现了SOTA。

本文亮点主要包括:

  1. 提出一种基于双U-Net的分层输入梯度网络(LIGN)。在基准数据集上的实验表明,该网络在PSNR和SSIM指标上表现出优异的性能。
  2. 提出了一种新的分层输入法,充分利用了输入图像的内部结构和频率信息。
  3. 将图像梯度深度融合到网络中,从而使网络收敛速度更快,并获得更多高频特征关注。

本文工作『Layered Input GradiNet for Image Denoising』发表于Knowledge-Based Systems (KBS),2022,254:109587。中科院1区、Top期刊。

  • 论文链接:https://www.sciencedirect.com/science/article/abs/pii/S0950705122008000
  • 代码:https://github.com/JerryYann/LIGN
  • 单位:东北师范大学
  • 作者:乔双,杨家瑞,张天,赵辰一*

01

研究背景

数字图像广泛应用于日常生活中。受多因素影响,如硬件条件、环境变量等,成像系统所成的图像都不可避免存在一定程度的质量退化,其中常见退化现象之一为噪声。噪声的存在对人眼感官,图像结构分析、医学诊断、科学研究等影响较大。因此,图像去噪作为计算机视觉领域的研究热点之一,一直受到科研人员的广泛关注。

本文研究方向围绕具体应用而展开。提出分层输入梯度网络(LIGN),从网络输入端到网络深层结构,以及网络的损失层均提出创新性结构。深度挖掘图像的结构信息,探讨图像不同频率特征的作用,以及通过锐化损失大幅度提高图像的视觉质量。分别在模拟噪声数据集和真实噪声数据集上,在PSNR和SSIM指标实现了SOTA。

02

方法

图1 整体网络框架

分层输入梯度网络的整体框架如图1所示。该网络由以下几个重要部件组成:分层输入,多尺度特征提取块,信息分流块,梯度网络和主网络。对于任意噪声图像

(灰度图像或彩色图像,尺寸为

,网络的输入端将输入图像进行分层,得到一组并行且尺寸为

的输入l。该输入被传入到多尺度特征提取块。多尺度特征提取块从分层输入中提取初始特征

(尺寸为

)的特征图:

(2-1)

其中,

为多尺度特征提取函数。该特征图由信息分流块分流给梯度网络和主网络(尺寸均为

),表示为

(2-2)

其中,

分别用于提取梯度网络和主网络的分流特征

。梯度网络尽可能地从噪声输入图像中复原其清晰图像的梯度,并提供给主网络。为了让主网络更好地融合梯度信息,提取的梯度经过正则化处理,表示为

(2-3)

其中,

表示扩大因子,

表示偏置项。

为梯度网络提取的梯度信息(尺寸为

)。最后将

传入主网络获得残差图像。这里使用一个长跳跃连接将噪声图像与网络的输出

连接,表示为

其中,

表示主网络。

为灰度图像的分层输入的第一层,彩色图像的前三层。

2.1 分层输入

图像中具有相同或相似纹理/边缘特征的像素通常在一定的像素值范围内,这将引导我们对输入图像进行分层,以获得分层的结构特征。网络的输入是噪声图像,噪声会毁坏图像的纹理或结构。那么在噪声图像上的分层是否有用?

如图2,可以看到,分层输入中的清晰图像子图与噪声子图在某一层具有相似的结构纹理,但连续的像素值变为离散。此外噪声的随机性将其他层结构映射到噪声子图的某一层,同时无特征层的噪点对于去噪网络是非常容易去除的。分层输入为网络提供了额外的结构信息,有助于网络对图像特征的复原。

图2 分层输入分析。最左和最右两幅图像分别为清晰图像和噪声图像,中间两幅图像分别为对应的清晰子图像和噪声子图像。从上到下分别是第三层、第七层和第八层。

2.2. 多尺度特征提取块和信息分流块

相对于单一的特征提取模块,多尺度特征提取块可以挖掘不同感受野大小的特征。网络浅层包含更加细腻的特征成分,宽的网络结构被证明可以提高网络性能。多尺度特征提取块的设计具有网络层浅和网络结构宽的优势。信息分流块的作用是将特征提取块提取的并行特征分离给两个网络。

2.3. GradiNet&MainNet

梯度网络(GradiNet)从噪声图中学习清晰图像的梯度,归一化后传给去噪网络(MainNet)。两个网络的结构如图3所示,均为类似U-Net结构。GradiNet完全学习图像的高频成分,即图像的纹理边缘特征等。同时,我们设置了机制阻止MainNet的反向传播梯度流向GradiNet(如图2中绿色箭头所示)。GradiNet在学习图像高频成分的同时,其反向传播梯度引导特征提取块关注高频成分。梯度网络的损失函数如下:

其中,

为拉普拉斯算子,

为GradiNet提取的梯度。MainNet采用2范数损失函数。

图3 主网络的结构

03

实验

本文选择了性能最先进的模拟噪声和真实噪声去除算法进行对比测试。实验结果如图4和表1数据所示,在模拟噪声数据集(BSD68,Kodak24等)上,尤其在高噪声强度下,实现了SOTA。同时在真实噪声数据集DND上略强于SOTA方法NBNet。

最后,对加入了锐化损失结构的网络结构进行性能测试,结果见图5。左边为LIGN的去噪结果,右边为加了锐化损失结构的去噪结果。可以看出加入锐化损失结构后图像的细节被增强。此外,锐化损失采用即插即用形式,可以按照实际应用选择使用。

图4 真实图像的去噪可视化

表1真实图像的去噪性能对比

图5 锐化损失的结果

04

总结

本文提出了基于梯度分层的图像去噪网络,可视化结果表明,锐化损失的结果具有更清晰的纹理,突出的边缘和舒适的视觉效果。我们相信,基于梯度的去噪网络将在未来得到进一步的应用和探索。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-10-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 我爱计算机视觉 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
基于深度学习的图像超分辨率方法 总结
懒得总结,就从一篇综述中选取了一部分基于深度学习的图像超分辨率方法。 原文:基于深度学习的图像超分辨率复原研究进展 作者:孙旭 李晓光 李嘉锋 卓力 北京工业大学信号与信息处理研究室 来源:中国知网
Natalia_ljq
2020/06/03
1.5K0
深度学习在图像处理的应用一览
计算机视觉的底层,图像处理,根本上讲是基于一定假设条件下的信号重建。这个重建不是3-D结构重建,是指恢复信号的原始信息,比如去噪声。这本身是一个逆问题,所以没有约束或者假设条件是无解的,比如去噪最常见的假设就是高斯噪声。
AI算法与图像处理
2019/09/26
1.5K0
深度学习在图像处理的应用一览
思维的碰撞|小博变换偶遇深度学习
在过去几年里,深度学习方法在图像降噪领域取得了极大的成功。在这篇论文中,作者提出一种稠密自引导小波网络用于真实世界图像降噪。
计算机视觉
2020/11/11
6940
思维的碰撞|小博变换偶遇深度学习
基于深度学习的低光照图像增强
之前在做光照对于高层视觉任务的影响的相关工作,看了不少基于深度学习的低光照增强(low-light enhancement)的文章[3,4,5,7,8,9,10],于是决定简单梳理一下。
小白学视觉
2022/02/12
2K0
基于深度学习的低光照图像增强
ECCV 2020 | SADNet:用于单图像去噪的空间自适应网络
Title:Spatial-Adaptive Network for Single ImageDenoising(SADNet):用于单张图像去噪的空间自适应网络
Amusi
2020/09/23
2.4K0
ECCV 2020 | SADNet:用于单图像去噪的空间自适应网络
基于深度学习的RGBD深度图补全算法文章鉴赏
【GiantPandaCV导语】本文针对3维视觉中的深度图补全问题,介绍了一下近年基于深度学习的RGB-D深度图补全算法进展。深度图的质量对3维视觉至关重要,深度图的优劣极大地影响了后续的3d识别等工作,但目前较多研究聚焦于自动驾驶领域的Lidar深度图的补全,而对RGB-D相机涉猎较少,故本文介绍几篇基于consumer RGB-D cameras深度图补全的深度学习方法,以此来看看近期该领域的发展现状。
BBuf
2021/07/01
2.3K0
基于深度学习的RGBD深度图补全算法文章鉴赏
超分辨率 | 综述!使用深度学习来实现图像超分辨率
今天给大家介绍一篇图像超分辨率邻域的综述,这篇综述总结了图像超分辨率领域的几方面:problem settings、数据集、performance metrics、SR方法、特定领域应用以结构组件形式,同时,总结超分方法的优点与限制。讨论了存在的问题和挑战,以及未来的趋势和发展方向。
AI算法修炼营
2020/05/26
6.9K0
超分辨率 | 综述!使用深度学习来实现图像超分辨率
算法金 | 深度学习图像增强方法总结
图像增强方法在数字图像处理中占有重要地位,它能够有效提高图像的视觉效果,增强图像的细节信息,从而在医学、遥感、工业检测等多个领域发挥重要作用
算法金
2024/07/14
3670
算法金 | 深度学习图像增强方法总结
深度学习的图像超分技术综述-输入单张图像(SISR)和输入多张图像的基于参考的图像(RefSR)
SISR方法输入一张低分辨率图像,利用深度神经网络学习LR-HR图像对之间的映射关系,最终将 LR图像重建为一张高分辨率图像。
JOYCE_Leo16
2024/03/19
6570
深度学习的图像超分技术综述-输入单张图像(SISR)和输入多张图像的基于参考的图像(RefSR)
【深度学习】基于深度学习的超分辨率图像技术一览
SR取得了显著进步。一般可以将现有的SR技术研究大致分为三大类:监督SR,无监督SR和特定领域SR(人脸)。
Twcat_tree
2023/11/25
4780
【深度学习】基于深度学习的超分辨率图像技术一览
2019年暑期实习、秋招深度学习算法岗面试要点及答案分享
本文主要整理了深度学习相关算法面试中经常问到的一些核心概念,并给出了细致的解答,分享给大家。
AI研习社
2019/09/12
7560
2019年暑期实习、秋招深度学习算法岗面试要点及答案分享
去雾算法总结(传统+深度学习)
1.Single Image Haze Removal Using Dark Channel Prior  何凯明  2009 CVPR
狼啸风云
2020/07/06
16.1K0
纹理分析以及结合深度学习来提升纹理分类效果
来源:AI 公园 本文约6400字,建议阅读10+分钟 本文为你介绍纹理分析及各种分析方法,并结合深度学习提升纹理分类。 人工智能的一个独特应用领域是帮助验证和评估材料和产品的质量。在IBM,我们开发了创新技术,利用本地移动设备,专业的微型传感器技术,和AI,提供实时、解决方案,利用智能手机技术,来代替易于出错的视觉检查设备和实验室里昂贵的设备。 在开发质量和可靠性检查的人工智能能力的同时,产品和材料的图像需要是高清晰度的或者是微观尺度的,因此,设计能够同时代表采样图像的局部和全局独特性的特征变得极为重要
数据派THU
2022/09/27
2.8K0
纹理分析以及结合深度学习来提升纹理分类效果
基于全局与局部感知网络的超高清图像去雾方法
带有雾霾的图像具有低对比度和模糊的特性,这会严重影响下游图像处理模型的表现,例如行人检测、图像分割等。对此,大量的单幅图像去雾方法被开发出来,它们的目的在于把输入的带有雾霾的图像转换成一张清晰图像。然而,伴随着移动设备和边缘设备对分辨率为4k图像处理方法的需求的不断增长,现存的图像去雾的方法很少能高效地处理一张带雾的超高清图像[1]。
一点人工一点智能
2024/04/25
3130
基于全局与局部感知网络的超高清图像去雾方法
SFT-GAN、CSRCNN、CSNLN、HAN+、Config (f)…你都掌握了吗?一文总结超分辨率分析必备经典模型(三)
 机器之心专栏 本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心公众号持续更新。 本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。 本文将分 3 期进行连载,共介绍 16 个在超分辨率任务上曾取得 SOTA 的经典模型。 第 1 期:SRCNN、DRCN、FSRCNN、ESPCN、SRGAN、RED
机器之心
2023/05/01
8020
SFT-GAN、CSRCNN、CSNLN、HAN+、Config (f)…你都掌握了吗?一文总结超分辨率分析必备经典模型(三)
DiffBIR:用生成式扩散先验实现盲图像恢复
图像恢复的目的是从低质量的观测中重建出高质量的图像。典型的图像恢复问题,如图像去噪、去模糊和超分辨率,通常是在受限的环境下定义的,其中退化过程是简单和已知的(例如,高斯噪声和双三次降采样)。为了处理现实世界中退化的图像,盲图像恢复(BIR)成为一个很有前途的方向。BIR的最终目标是在具有一般退化的一般图像上实现真实的图像重建。BIR不仅扩展了经典图像恢复任务的边界,而且具有广泛的实际应用领域。BIR的研究还处于初级阶段。根据问题设置的不同,现有的BIR方法大致可以分为三个研究方向,即盲图像超分辨率(BSR)、零次图像恢复(ZIR)和盲人脸恢复(BFR)。它们都取得了显著的进步,但也有明显的局限性。BSR最初是为了解决现实世界的超分辨率问题而提出的,其中低分辨率图像包含未知的退化。根据最近的BSR调查,最流行的解决方案可能是BSRGAN和Real-ESRGAN。它们将BSR表述为一个有监督的大规模退化过拟合问题。为了模拟真实的退化,分别提出了退化洗牌策略和高阶退化建模,并用对抗性损失来以端到端方式学习重建过程。它们确实消除了一般图像上的大多数退化,但不能生成真实的细节。此外,它们的退化设置仅限于×4或者×8超分辨率,这对于BIR问题来说是不完整的。第二组ZIR是一个新出现的方向。代表有DDRM、DDNM、GDP。它们将强大的扩散模型作为附加先验,因此比基于GAN的方法具有更大的生成能力。通过适当的退化假设,它们可以在经典图像恢复任务中实现令人印象深刻的零次恢复。但是,ZIR的问题设置与BIR不一致。他们的方法只能处理明确定义的退化(线性或非线性),但不能很好地推广到未知的退化。第三类是BFR,主要研究人脸修复。最先进的方法可以参考CodeFormer和VQFR。它们具有与BSR方法相似的求解方法,但在退化模型和生成网络上有所不同。由于图像空间较小,这些方法可以利用VQGAN和Transformer在真实世界的人脸图像上取得令人惊讶的好结果。然而,BFR只是BIR的一个子域。它通常假设输入大小固定,图像空间有限,不能应用于一般图像。由以上分析可知,现有的BIR方法无法在一般图像上实现一般退化的同时实现真实图像的重建。因此需要一种新的BIR方法来克服这些限制。本文提出了DiffBIR,将以往工作的优点整合到一个统一的框架中。具体来说,DiffBIR(1)采用了一种扩展的退化模型,可以推广到现实世界的退化;(2)利用训练良好的Stable Diffusion作为先验来提高生成能力;(3)引入了一个两阶段的求解方法来保证真实性和保真度。本文也做了专门的设计来实现这些策略。首先,为了提高泛化能力,本文将BSR的多种退化类型和BFR的广泛退化范围结合起来,建立了一个更实用的退化模型。这有助于DiffBIR处理各种极端退化情况。其次,为了利用Stable Diffusion,本文引入了一个注入调制子网络-LAControlnet,可以针对特定任务进行优化。与ZIR类似,预训练的Stable Diffusion在微调期间是固定的,以保持其生成能力。第三,为了实现忠实和逼真的图像重建,本文首先应用恢复模块(即SwinIR)来减少大多数退化,然后微调生成模块(即LAControlnet)来生成新的纹理。如果没有这个部分,模型可能会产生过度平滑的结果(删除生成模块)或生成错误的细节(删除恢复模块)。此外,为了满足用户多样化的需求,本文进一步提出了一个可控模块,可以实现第一阶段的恢复结果和第二阶段的生成结果之间的连续过渡效果。这是通过在去噪过程中引入潜在图像引导而无需重新训练来实现的。适用于潜在图像距离的梯度尺度可以调整以权衡真实感和保真度。在使用了上述方法后,DiffBIR在合成和现实数据集上的BSR和BFR任务中都表现出优异的性能。值得注意的是,DiffBIR在一般图像恢复方面实现了很大的性能飞跃,优于现有的BSR和BFR方法(如BSRGAN、Real-ESRGAN、CodeFormer等)。可以观察到这些方法在某些方面的差异。对于复杂的纹理,BSR方法往往会产生不真实的细节,而DiffBIR方法可以产生视觉上令人愉悦的结果。对于语义区域,BSR方法倾向于实现过度平滑的效果,而DiffBIR可以重建语义细节。对于微小的条纹,BSR方法倾向于删除这些细节,而DiffBIR方法仍然可以增强它们的结构。此外,DiffBIR能够处理极端的退化并重新生成逼真而生动的语义内容。这些都表明DiffBIR成功地打破了现有BSR方法的瓶颈。对于盲人脸恢复,DiffBIR在处理一些困难的情况下表现出优势,例如在被其他物体遮挡的面部区域保持良好的保真度,在面部区域之外成功恢复。综上所述,DiffBIR首次能够在统一的框架内获得具有竞争力的BSR和BFR任务性能。广泛而深入的实验证明了DiffBIR优于现有的最先进的BSR和BFR方法。
用户1324186
2024/02/21
1.1K0
DiffBIR:用生成式扩散先验实现盲图像恢复
基于深度学习的图像增强综述
图像增强的定义非常广泛,一般来说,图像增强是有目的地强调图像的整体或局部特性,例如改善图像的颜色、亮度和对比度等,将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征,提高图像的视觉效果。传统的图像增强已经被研究了很长时间,现有的方法可大致分为三类,空域方法是直接对像素值进行处理,如直方图均衡,伽马变换;频域方法是在某种变换域内操作,如小波变换;混合域方法是结合空域和频域的一些方法。传统的方法一般比较简单且速度比较快,但是没有考虑到图像中的上下文信息等,所以取得效果不是很好。 近年来,卷积神经网络在很多低层次的计算机视觉任务中取得了巨大突破,包括图像超分辨、去模糊、去雾、去噪、图像增强等。对比于传统方法,基于CNN的一些方法极大地改善了图像增强的质量。现有的方法大多是有监督的学习,对于一张原始图像和一张目标图像,学习它们之间的映射关系,来得到增强后的图像。但是这样的数据集比较少,很多都是人为调整的,因此需要自监督或弱监督的方法来解决这一问题。本文介绍了近年来比较经典的图像增强模型,并分析其优缺点。
Natalia_ljq
2020/06/03
6.6K0
基于深度学习的图像增强综述
【深度学习 | 风格迁移】神经网络风格迁移,原理详解&附详细案例&源码
风格迁移这一想法与纹理生成的想法密切相关,在 2015 年开发出神经风格迁移之前,这一想法就已经在图像处理领域有着悠久的历史。但事实证明,与之前经典的计算机视觉技术实现相比,基于深度学习的风格迁移实现得到的结果是无与伦比的,并且还在计算机视觉的创造性应用中引发了惊人的复兴。
计算机魔术师
2024/01/13
3.7K0
【深度学习 | 风格迁移】神经网络风格迁移,原理详解&附详细案例&源码
RealSR新突破|中科大提出全频带区域自适应图像超分|ORNet
Paper: https://arxiv.org/pdf/2012.06131.pdf
AIWalker
2021/01/05
7890
基于深度学习的图像增强综述
这篇博客主要介绍之前看过的一些图像增强的论文,针对普通的图像,比如手机拍摄的那种,比低光照图像增强任务更简单。
3D视觉工坊
2021/05/18
2.2K0
基于深度学习的图像增强综述
推荐阅读
相关推荐
基于深度学习的图像超分辨率方法 总结
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档