前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >毫秒级图像去噪!英伟达、MIT新AI系统完美去水印

毫秒级图像去噪!英伟达、MIT新AI系统完美去水印

作者头像
新智元
发布于 2018-07-31 09:34:27
发布于 2018-07-31 09:34:27
1.7K0
举报
文章被收录于专栏:新智元新智元

新智元报道

来源:arxiv

编译:肖琴

【新智元导读】没有什么能阻挡我们对高清无码大图的向往。在ICML2018上,英伟达和MIT等机构的研究人员展示了一项图像降燥技术Noise2Noise,能够自动去除图片中的水印、模糊等噪音,几乎能完美复原,而且渲染时间是毫秒级。

论文地址:https://arxiv.org/pdf/1803.04189.pdf

去水印技术又上了个新台阶。

由Nvidia、麻省理工学院和阿尔托大学开发的深度学习去噪方法,无需使用没有“噪声”的清晰图像,就能够实现完美去水印。

效果如下:

什么是图片“噪声”?

如果你在日落之后拍摄过照片,那么你可能对图像的“噪声”很熟悉了。当用摄像头对焦光线昏暗的场景时,图像会呈现颗粒、异常的彩色或白色斑点。

人们现在可以用软件在一定程度上去噪或降噪,深度学习方法去噪也已经有一些解决方案,但存在一个重要缺陷:需要配对的清晰图像和噪声图像来训练神经网络。

如何生成清晰的图像是医学成像检测(如MRI)和天文图像中的共同问题,因为这些场景根本没有足够的时间和光线来拍摄清晰图像。时间在计算机图形技术中也是一个问题。生成清晰的图像数据来训练降噪器的任务可能需要几天或几周的时间。

Noise2Noise:

该团队使用了来自ImageNet数据集的5万张图像来训练其人工智能系统,该系统能够从图像中去除噪声,即使它从未见过没有噪声的对应图像。

这个名为“噪声到噪声”(Noise2Noise)的AI系统是使用深度学习创建的,它不是基于配对的清晰图像和噪声图像来训练网络,而是基于配对的噪声图像来训练网络,并且只需要噪声图像。计算机生成的图像和MRI扫描图像也被用来训练Noise2Noise。

通过只使用噪声来训练Noise2Noise,研究人员希望这种方法可以用于已知含有大量噪声的图像,比如天体摄影、核磁共振成像(MRI)或大脑扫描图像。

从左到右:输入的噪声图像、去噪图像、和原始图像

来自IXI数据集的50名人类受试者的近5000张图像被用于训练Noise2Noise的MRI图像去噪能力。在没有人工噪声的情况下,结果可能比原始图像稍微模糊一些,但仍然很好地还原了清晰度。

MRI图像去噪

Nvidia的研究人员Jacob Munkberg说:“这是一个概念证明,我们在一个公共核磁共振数据库上进行训练,但在未来,它可能会显示出在实际应用中的希望。”

Noise2Noise系统通过使用一个神经网络来实现这一点,该神经网络使用有损的图像来训练。它不需要干净的图像,但它需要观察源图像两次。实验表明,受不同的合成噪声(加性高斯噪声、泊松噪声和binomial噪声)影响的目标图像仍能与使用干净样本恢复的图像有“几乎相同”的质量。该系统最令人兴奋的是,它可以显著减少图像渲染所需的时间——毫秒级别

研究人员在论文中写道:“我们观察到,在适当的,常见的情况下,我们可以学习仅从损坏的示例重建信号,而无需观察干净的信号,并且其效果与使用干净样本一样好。如我们在下文所展示的,从统计角度来看,我们的结论可能是微不足道的,但在实践中,通过解除对清洁数据可用性的要求,这种方法显着简化了学习信号的重建。”

实验:

我们通过实验研究了噪声目标(noisy-target)训练的实际特性,并确定了不需要干净目标的各种情况。

加性高斯噪声(Additive Gaussian noise)

首先,我们用加性高斯噪声研究噪声目标的影响。这是一种简单的分布,我们可以从中抽取样本,从而通过破坏干净的图像来生成无限数量的合成训练数据。

对高斯噪声去噪的示例

这里,我们的baseline是最近state-of-the-art的方法“RED30”,这是一个具有128个特征图的30层的分层残差网络,已经被证明是非常有效的。

对加性高斯噪声的去噪性能

来自3个测试数据集KODAK, BSD300和SET14的PSNR结果,包括高斯噪声、泊松噪声和Bernoulli noise噪声

泊松噪声(Poisson noise)

泊松噪声是照片噪声的主要来源。它和高斯一样是零均值,但是很难去除,因为它与信号有关。

对Poisson noise去噪的示例

眼部的细节

高斯噪声、泊松噪声和Bernoulli noise噪声的示例结果。

去除图像中文字的效果:

从此不怕弹幕挡脸

如果要去除图像中的文字,正确答案是中间值(L1 loss)而不是平均值(L2 loss)

随机值脉冲噪声用噪声代替了一些像素,并保留了其他像素的颜色。

脉冲噪声去噪示例

在随机值脉冲噪声的情况下,模式(L0)产生了无偏的结果,与平均值(L2)或中间值(L1)不同

这项工作将于本周在瑞典斯德哥尔摩召开的ICML会议上公布。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-07-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Reddit最热:一个专门给不可描述照片加水印的APP被AI破解了!
一项对10300名18岁以下青少年的调查表明,sexting越来越普遍,15%的青少年表示他们发过。在个别欧美国家,这一比例会更高,比如在比利时,有近50%的15-21岁青少年都干过这种事。
新智元
2019/12/21
1.3K0
Noise2Noise图像去噪
本文复现论文Noise2Noise: Learning Image Restoration without Clean Data中提出的图像去噪方法,并使用最广泛应用的高斯噪声与泊松噪声来做实验。原文连接https://arxiv.org/abs/1803.04189
Srlua
2024/12/12
2360
Noise2Noise图像去噪
从没见过干净图片,英伟达AI就学会了去噪大法 | ICML论文
润滑栗 发自 凹非寺 量子位 出品 | 公众号 QbitAI △ Noise2Noise:我有特别的降噪技巧 如今,会去噪的神经网络,早已算不上稀有物种。 不过,英伟达的Noise2Noise,和普通
量子位
2018/07/19
8500
【论文复现】Noise2Noise图像去噪
本文复现论文Noise2Noise: Learning Image Restoration without Clean Data中提出的图像去噪方法,并使用最广泛应用的高斯噪声与泊松噪声来做实验。原文连接https://arxiv.org/abs/1803.04189
Eternity._
2024/12/15
3930
【论文复现】Noise2Noise图像去噪
ICML 2018 | 英伟达提出仅使用噪点图像训练的图像增强方法,可去除照片噪点
近期在深度学习领域的研究聚焦于通过展示带噪点和清晰的图像示例对来训练神经网络修复图像。然后 AI 系统学习如何弥补差异。新方法的不同之处在于,它仅需要两张都带噪点的输入图像来训练。
机器之心
2018/07/26
7030
ICML 2018 | 英伟达提出仅使用噪点图像训练的图像增强方法,可去除照片噪点
图像去噪--Noise2Noise: Learning Image Restoration without Clean Data
Noise2Noise: Learning Image Restoration without Clean Data ICML 2018
用户1148525
2019/05/27
2K0
什么是图像噪声?是如何产生的?图像去噪技术都有哪些?
在一些图像中,像素值会在原始场景理想均匀的区域内变化,其原因要么是光子或其他信号的有限计数统计、在芯片内的电子偏移中引入的损耗;要么是放大器或电缆中出现了电子噪声。任何情况下,这种变化通常称为噪声,而由图像到噪声电平表示的场景中出现的差别引起的对比度比值,称为信噪比。
微帧Visionular
2024/11/05
8200
什么是图像噪声?是如何产生的?图像去噪技术都有哪些?
使用深度学习进行图像去噪
使用深度学习架构会更好的解决这个问题。目前看深度学习远远超过了传统的去噪滤波器。在这篇文章中,我将使用一个案例来逐步解释几种方法,从问题的形成到实现最先进的深度学习模型,然后最终看到结果。
deephub
2021/02/12
3.3K0
使用深度学习进行图像去噪
使用自编码器进行图像去噪
正确理解图像信息在医学等领域是至关重要的。去噪可以集中在清理旧的扫描图像上,或者有助于癌症生物学中的特征选择。噪音的存在可能会混淆疾病的识别和分析,从而导致不必要的死亡。因此,医学图像去噪是一项必不可少的预处理技术。
deephub
2021/05/18
1.3K0
使用自编码器进行图像去噪
【技术综述】一文道尽传统图像降噪方法
图像预处理算法的好坏直接关系到后续图像处理的效果,如图像分割、目标识别、边缘提取等,为了获取高质量的数字图像,很多时候都需要对图像进行降噪处理,尽可能的保持原始信息完整性(即主要特征)的同时,又能够去除信号中无用的信息。
用户1508658
2019/07/26
3K0
【技术综述】一文道尽传统图像降噪方法
【星球知识卡片】深度学习图像降噪有哪些关键技术点,如何学习
图像去噪模型的输出是无噪声的图像,与输入图像大小相同,所以可以使用图像分割一类的模型,即经典的基于跳层连接的卷积与反卷积对称结构,优化目标为逐个像素的欧式距离损失。另外在信息处理领域中,学习信号的改变量往往比学习原始信号更加简单,这被用于非常有效的残差网络。DnCNN模型借鉴了这个思路,它不是直接输出去噪图像,而是预测残差图像,即噪声观察和潜在的干净图像之间的差异。
用户1508658
2020/11/03
1.1K0
【星球知识卡片】深度学习图像降噪有哪些关键技术点,如何学习
一文轻松学会图形失真修复-图像去噪滤波算法汇总(Python)
看完本篇文章的所有操作和实践,就不需要去花钱修复照片了自己也能做到而且保证十分便捷!本篇文章将介绍常用到的图像去噪滤波算法,采用实例代码和处理效果一并展现的方式进行介绍,能够更直观的看到每种算法的效果。本篇文章偏实战,所以不会涉及到过多每种算法的原理理论计算公式,以一篇文章快速了解并实现这些算法,以效率最高的方式熟练这些知识。
fanstuck
2024/01/24
2K0
一文轻松学会图形失真修复-图像去噪滤波算法汇总(Python)
NVIDIA新研究:AI只通过噪点图像的训练就可以修复照片
如果在低光照下拍摄的照片,噪音和伪影可以自动消除,那将会如何;如果你的照片库中有颗粒状或像素化的图像呢,你会想要修复它们吗?现在一种基于深度学习的方法已经学会了通过简单查看损坏的照片的示例来修复照片。
AiTechYun
2018/07/27
4590
NVIDIA新研究:AI只通过噪点图像的训练就可以修复照片
CVPR2023 | 提升图像去噪网络的泛化性,港科大&上海AILab提出 MaskedDenoising,已开源!
但是,现有的深度学习去噪方法存在一个关键问题——泛化能力差。大多数方法都是在高斯噪声上训练和测试的。当遇到训练过程中未见过的噪声时,这些方法的效果会急剧下降。因为深度网络很容易过拟合训练数据,普通的学习方式使得网络仅仅学会如何去除高斯噪声,未学会图像的内在结构。
AIWalker
2023/09/01
2.8K0
CVPR2023 | 提升图像去噪网络的泛化性,港科大&上海AILab提出 MaskedDenoising,已开源!
从高斯噪声到生成图像-扩散模型的数学原理与YOLO结合应用解析
扩散模型近年来在生成任务上表现出了卓越的效果,尤其是在图像生成领域。这篇文章将介绍扩散模型的核心思想,从高斯噪声到生成图像的整个过程,并结合具体的数学原理来解释这一方法的工作机制。最后,我们将展示一个基于Python的代码实例来演示扩散模型的实现。
一键难忘
2024/09/08
7090
【杂谈】那些底层的图像处理问题中,GAN能有什么作为?
图像在产生和传输过程中都会受到噪声的干扰,因此图像降噪是一个非常基础的问题,生成式模型GAN在捕捉噪声的分布上有天然的优势。
用户1508658
2020/02/26
1.3K0
DiffBIR:用生成式扩散先验实现盲图像恢复
图像恢复的目的是从低质量的观测中重建出高质量的图像。典型的图像恢复问题,如图像去噪、去模糊和超分辨率,通常是在受限的环境下定义的,其中退化过程是简单和已知的(例如,高斯噪声和双三次降采样)。为了处理现实世界中退化的图像,盲图像恢复(BIR)成为一个很有前途的方向。BIR的最终目标是在具有一般退化的一般图像上实现真实的图像重建。BIR不仅扩展了经典图像恢复任务的边界,而且具有广泛的实际应用领域。BIR的研究还处于初级阶段。根据问题设置的不同,现有的BIR方法大致可以分为三个研究方向,即盲图像超分辨率(BSR)、零次图像恢复(ZIR)和盲人脸恢复(BFR)。它们都取得了显著的进步,但也有明显的局限性。BSR最初是为了解决现实世界的超分辨率问题而提出的,其中低分辨率图像包含未知的退化。根据最近的BSR调查,最流行的解决方案可能是BSRGAN和Real-ESRGAN。它们将BSR表述为一个有监督的大规模退化过拟合问题。为了模拟真实的退化,分别提出了退化洗牌策略和高阶退化建模,并用对抗性损失来以端到端方式学习重建过程。它们确实消除了一般图像上的大多数退化,但不能生成真实的细节。此外,它们的退化设置仅限于×4或者×8超分辨率,这对于BIR问题来说是不完整的。第二组ZIR是一个新出现的方向。代表有DDRM、DDNM、GDP。它们将强大的扩散模型作为附加先验,因此比基于GAN的方法具有更大的生成能力。通过适当的退化假设,它们可以在经典图像恢复任务中实现令人印象深刻的零次恢复。但是,ZIR的问题设置与BIR不一致。他们的方法只能处理明确定义的退化(线性或非线性),但不能很好地推广到未知的退化。第三类是BFR,主要研究人脸修复。最先进的方法可以参考CodeFormer和VQFR。它们具有与BSR方法相似的求解方法,但在退化模型和生成网络上有所不同。由于图像空间较小,这些方法可以利用VQGAN和Transformer在真实世界的人脸图像上取得令人惊讶的好结果。然而,BFR只是BIR的一个子域。它通常假设输入大小固定,图像空间有限,不能应用于一般图像。由以上分析可知,现有的BIR方法无法在一般图像上实现一般退化的同时实现真实图像的重建。因此需要一种新的BIR方法来克服这些限制。本文提出了DiffBIR,将以往工作的优点整合到一个统一的框架中。具体来说,DiffBIR(1)采用了一种扩展的退化模型,可以推广到现实世界的退化;(2)利用训练良好的Stable Diffusion作为先验来提高生成能力;(3)引入了一个两阶段的求解方法来保证真实性和保真度。本文也做了专门的设计来实现这些策略。首先,为了提高泛化能力,本文将BSR的多种退化类型和BFR的广泛退化范围结合起来,建立了一个更实用的退化模型。这有助于DiffBIR处理各种极端退化情况。其次,为了利用Stable Diffusion,本文引入了一个注入调制子网络-LAControlnet,可以针对特定任务进行优化。与ZIR类似,预训练的Stable Diffusion在微调期间是固定的,以保持其生成能力。第三,为了实现忠实和逼真的图像重建,本文首先应用恢复模块(即SwinIR)来减少大多数退化,然后微调生成模块(即LAControlnet)来生成新的纹理。如果没有这个部分,模型可能会产生过度平滑的结果(删除生成模块)或生成错误的细节(删除恢复模块)。此外,为了满足用户多样化的需求,本文进一步提出了一个可控模块,可以实现第一阶段的恢复结果和第二阶段的生成结果之间的连续过渡效果。这是通过在去噪过程中引入潜在图像引导而无需重新训练来实现的。适用于潜在图像距离的梯度尺度可以调整以权衡真实感和保真度。在使用了上述方法后,DiffBIR在合成和现实数据集上的BSR和BFR任务中都表现出优异的性能。值得注意的是,DiffBIR在一般图像恢复方面实现了很大的性能飞跃,优于现有的BSR和BFR方法(如BSRGAN、Real-ESRGAN、CodeFormer等)。可以观察到这些方法在某些方面的差异。对于复杂的纹理,BSR方法往往会产生不真实的细节,而DiffBIR方法可以产生视觉上令人愉悦的结果。对于语义区域,BSR方法倾向于实现过度平滑的效果,而DiffBIR可以重建语义细节。对于微小的条纹,BSR方法倾向于删除这些细节,而DiffBIR方法仍然可以增强它们的结构。此外,DiffBIR能够处理极端的退化并重新生成逼真而生动的语义内容。这些都表明DiffBIR成功地打破了现有BSR方法的瓶颈。对于盲人脸恢复,DiffBIR在处理一些困难的情况下表现出优势,例如在被其他物体遮挡的面部区域保持良好的保真度,在面部区域之外成功恢复。综上所述,DiffBIR首次能够在统一的框架内获得具有竞争力的BSR和BFR任务性能。广泛而深入的实验证明了DiffBIR优于现有的最先进的BSR和BFR方法。
用户1324186
2024/02/21
1.2K0
DiffBIR:用生成式扩散先验实现盲图像恢复
AI入门 | 十分钟了解当前热门的扩散模型(Diffusion Model)
机器学习和人工智能算法不断发展,以解决复杂问题并加深我们对数据的理解。其中一个引人注目的模型类别是扩散模型,它们因能够捕捉和模拟像数据生成和图像合成这样的复杂过程而受到重视。
ClimAI 智慧气象
2023/12/01
19.2K0
AI入门 | 十分钟了解当前热门的扩散模型(Diffusion Model)
使用深度学习的模型对摄影彩色图像进行去噪
大多数图像去噪器技术专注于去除AWGN(高斯白噪声)。通常,噪声是综合添加的并且涉及各种技术来去除这些图像。但是随着深度学习的进步,重点已转向为现实世界中的嘈杂彩色图像设计降噪架构。实际的嘈杂图像是通过具有不同设置或在弱光条件下的不同摄像机获得的。在较低的相机ISO设置下或在强光条件下,也可以获得相应的清晰图像。具有干净且嘈杂的图像对,我们可以训练深度学习卷积体系结构以对图像进行降噪。图像去噪效果可能是肉眼可见的。我使用PSNR和SSIM指标来衡量图像去噪器性能。
deephub
2021/05/18
1.1K0
使用深度学习的模型对摄影彩色图像进行去噪
告别水下模糊!SU-YOLO:轻量化+尖峰神经网络,用“类脑计算”实现水下目标毫秒级识别
水下物体探测对于海洋研究和工业安全检查至关重要。然而,复杂的光学环境和有限的水下设备资源给实现高精度和低功耗带来了巨大挑战。为了解决这些问题,提出了一种尖峰神经网络(SNN)模型——尖峰水下YOLO(SU-YOLO)。利用SNN的轻量级和高能效特性,SU-YOLO采用了一种新颖的基于尖峰的水下图像识别方法,该方法完全基于整数加法,能以最小的计算开销提高特征图的质量。此外,我们还引入了分批归一化(Separated Batch Normalization,SEBN)技术,该技术可在多个时间步长内对特征图进行独立归一化,并与残差结构进行优化整合,从而更有效地捕捉SNN的时间动态。重新设计的尖峰残差块将跨阶段部分网络(CSPNet)与YOLO架构整合在一起,以减轻尖峰退化并增强模型的特征提取能力。在URPC2019水下数据集上的实验结果表明,SU-YOLO在6.97M个参数下实现了78.8%的mAP,能耗为2.98 mJ,在检测精度和计算效率上都超越了主流SNN模型。这些结果凸显了SNN在工程应用中的潜力。
CoovallyAIHub
2025/04/08
2350
告别水下模糊!SU-YOLO:轻量化+尖峰神经网络,用“类脑计算”实现水下目标毫秒级识别
推荐阅读
相关推荐
Reddit最热:一个专门给不可描述照片加水印的APP被AI破解了!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档