首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >论文解读:使用带门控卷积进行生成式深层图像修复方法

论文解读:使用带门控卷积进行生成式深层图像修复方法

作者头像
deephub
发布于 2020-12-11 02:05:29
发布于 2020-12-11 02:05:29
2.3K0
举报
文章被收录于专栏:DeepHub IMBADeepHub IMBA

今天,我们将深入研究一种名为DeepFill v2的非常实用的生成型深层图像修复方法。本文可以视为DeepFill v1,Partial Convolution和EdgeConnect的增强版本。简单的说,DeepFill v1中提出的上下文注意(CA)层和EdgeConnect中引入的可选的用户草图输入概念都嵌入在DeepFill v2中。同样,部分卷积(PConv)被修改为门控卷积(GConv),其中基于规则的掩码更新被公式化为可学习的下一卷积层的门控。有了这些想法,DeepFill v2可以比以前的最新方法获得高质量的自由形式修复。图1显示了使用DeepFill v2的一些自由形式的修复结果。

动机

回想一下,已经提出了部分卷积(PConv)来分离有效像素和无效像素,从而使卷积结果仅取决于有效像素,并且已经提出了Edge生成器来估计缺失区域的内部架构,进一步提高修复性能,本文的作者想要将这些技术与他们的上下文的关注(CA)层进一步加强修复的结果。

首先,PConv使用基于规则的掩码更新来分隔有效和无效像素。基于规则的掩码更新是手工制作的,是不可学习的。读者可以参考我们之前翻译的一篇文章对PConv进行简短的回顾。由于PConv是不可学习的,因此改进它的最直接的方法是使其可学习。

其次,之前的方法通常将掩码图像和掩码图像输入生成器网络完成。如果我们还允许用户的草图输入作为任务的附加条件呢?生成器知道如何区分用户的草图输入和掩码图像输入吗?一个简单的答案,使用门控卷积(PConv的一个可学习的版本)就可以了!

介绍

在以下各节中,我们可以将使用更多时间介绍最重要的概念“门控卷积”。

DeepFill v2网络体系结构。论文是他们之前工作(DeepFill v1)的改进版本。所以除了被使用门控卷积取代了标准卷积之外,网络架构非常相似。我们之前已经介绍过DeepFill v1。这里DeepFill v1最重要的思想是上下文注意(CA)层,它允许生成器使用由遥远的空间位置提供的信息来重建局部缺失的像素。因此,DeepFill v2也遵循由粗到细的两阶段网络结构。第一生成器网络负责粗重建,而第二生成器网络负责对粗填充的图像进行细化。

有趣的是,损失函数只有两个最标准的损失项用于训练网络,即L1损失和GAN损失。这是这篇论文的主张之一,因为其他最先进的绘画论文使用5-6损失来训练他们的网络。我将很快谈论在这篇论文中使用的GAN损失。。

解决方案简述

为了进一步改进处理不规则掩码的部分卷积,作者提出了门控卷积,门控卷积可以看作是部分卷积的可学习版本。除了门控卷积之外,还允许可选的用户草图输入,以增强模型的交互编辑能力。最后,与我们在上一篇文章中介绍的EdgeConnect类似,将谱归一化(Spectral Normalization SN)[2]应用于鉴别器以稳定训练过程。

图2显示了DeepFill v2的网络架构。正如您所看到的,这是一个由粗到细两阶段的网络,带有门控卷积。粗糙生成器以掩码图像、掩码图像和可选的用户草图图像作为输入,对缺失区域进行粗糙重建。然后,粗填充的图像将被传递到第二个细化生成器网络进行细化。请注意,DeepFill v1中提出的上下文注意(CA)层被用于此细化网络。

对于鉴别器,本文采用了著名的PatchGAN结构[3]。除了使用PatchGAN之外,作者还对鉴别器的每个标准卷积层使用了谱归一化(SN)[2],以提高训练的稳定性。

门控卷积(Gated Convolution)

图3显示了部分卷积(PConv)和建议的门控卷积(GatedConv)之间的差异。简而言之,在PConv中,使用标准卷积层和S型激活函数来更新掩码,而不是使用基于规则的掩码更新。在经过S型激活函数后,所有值都将落入[0,1],这可以指示每个局部区域的重要性(或有效性)。 门控卷积的输出计算为

其中输出是两个标准卷积层的输出的逐个元素相乘,一层后跟任何激活函数,另一层后跟一个S型激活函数。

标准卷积层后接一个sigmoid函数作为软门控,在输入到下一个卷积层之前对当前卷积层的输出进行加权。注意,对于硬门控,我们只有0或1来做加权,但是对于软门控,我们可以采用0到1进行加权,这更加灵活,此操作是可以学习的。。

因此,您可以看到门控卷积的思想非常简单且易于实现。

损失函数

训练模型的损失函数由两个损失项组成,一个是像素级L1重建损失(L1损失),另一个是SN-PatchGAN损失。请注意,用于平衡这两个损耗项的超参数为1:1。

生成器的SN-PatchGAN损耗非常简单。它是SN-PatchGAN鉴别器输出的负平均值。实际上,这是铰链损耗,这在许多GAN框架中也很常见。

实验

自由形式的掩码生成和边缘贴图作为用户草图输入

提出了一种在训练过程中实时生成自由形状掩码的方法。我认为最简单的方法是直接在这里使用他们的代码。感兴趣的读者可以参考他们的论文了解详情。

对于可选的用户草图输入,作者使用HED边缘检测器[4]生成边缘图作为草图输入。请注意,草图输入是可选的。对于对交互式编辑用户草图输入感兴趣的读者,我强烈建议您阅读他们的论文。

与以前的修复论文相似,作者在Places2和CelebA-HQ数据集上评估了他们的模型。这两个数据集通常用于深度图像修复任务。

表1列出了两个供读者参考的客观评价度量数。正如我在之前的文章中提到的,对于深图像的补绘,目前还没有一个好的定量评估指标。因此,这些数字仅供参考,你应该关注填充图像的视觉质量。正如您所看到的,所提出的模型提供了最低的l1和l2误差。

定性比较

图4给出了不同深度图像补绘方法的定性比较。很明显,提出的模型(GatedConv)在视觉质量方面优于所有其他方法。您可以看到,该方法提供了不明显的颜色不一致的inpaint结果。

从图5可以看出,与前一种不允许用户草图输入的方法相比,所提出的模型能够理解和利用用户草图输入,从而进一步提高inpaint结果。你可以看到,论文的方法提供了更好的inpaint结果没有颜色不一致。

图6显示了一个对象删除示例,您可以看到,所提出的方法可以以更好的视觉质量完全删除对象。

图7显示了一些以用户草图输入为指导的图像填充示例。你可以看到交互式编辑是如何通过提出的方法来实现的。

SN-PatchGAN的消融实验

图8显示了SN-PatchGAN的消融研究。与标准的单个全局GAN相比,SN-PatchGAN的使用带来了更好的修复效果。作者声称,简单的L1损失和SN-PatchGAN损失的简单组合可以产生逼真的修复效果。

结论

本文的主要思想是门控卷积。门控卷积是部分卷积的可学习版本。我们可以通过使用一个额外的标准卷积层和一个S型函数来实现门控卷积,如图3所示。与现有的修补方法相比,门控卷积和SN-PatchGAN的使用显着改善了修补效果。作者还展示了如何通过允许可选的用户草图输入来实现交互式编辑。使用用户草图输入,可以实现更好和有意义的修复效果。因此,这是文献中非常实用的深层图像修复方法。

到目前为止,仍然很难用复杂的场景结构和较大的缺失区域来填充图像。因此,极限图像修复将是一个有希望的方向。让我们一起学习和阅读更多内容:)

参考文献

[1] Jiahui Yu, Zhe Lin, Jimei Yang, Xiaohui Shen, Xin Lu, and Thomas Huang, “Free-Form Image Inpainting with Gated Convolution,” Proc. International Conference on Computer Vision (ICCV), 2019.

[2] Takeru Miyato, Toshiki Kataoka, Masanori Koyama, and Yuichi Yoshida, “Spectral Normalization for Generative Adversarial Networks,” Proc. International Conference on Learning Representations (ICLR), 2018.

[3] Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, and Alexei A. Efros, “Image-to-Image Translation with Conditional Adversarial Networks,” Proc. Computer Vision and Pattern Recognition (CVPR), 21–26 Jul. 2017.

[4] Saining Xie, and Zhuowen Tu, “Holistically-nested edge detection,” Proc. International Conference on Computer Vision (ICCV), 2015.

作者:Chu-Tak Li

deephub翻译组

本文源代码:https://github.com/JiahuiYu/generative_inpainting

原文地址:https://towardsdatascience.com/a-practical-generative-deep-image-inpainting-approach-1c99fef68bd7

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-11-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DeepHub IMBA 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
揭秘2021抖音和快手APP图像修复背后的核心技术,毫无ps痕迹
由于CNN、GAN、Transformer等模型在CV与NLP领域都实现了很好的跨界,最近非常火热的Prompt也开始在多模态领域中有所应用了,因此我们有必要借鉴一些CV领域中Paper的idea,以拓宽自己的视野,那么今天就给大家分享一下图像修复(Image Inpainting)领域中值得一读的六篇顶会论文,希望能给大家带来一些不一样的灵感。
对白
2022/04/01
8070
揭秘2021抖音和快手APP图像修复背后的核心技术,毫无ps痕迹
图片修补 EdgeConnect 论文的阅读与翻译:生成边缘轮廓先验,再填补缺失内容
本文将要介绍的论文就是:EdgeConnect: Generative Image Inpainting with Adversarial Edge Learning,因为知乎在(2019-02-02)前,缺少详细介绍这篇论文的文章,而我最近需要复现它,所以顺便在这里对这篇论文进行介绍,毕竟还是中文母语阅读起来方便,关于翻译或者算法的指正与争议。
汀丶人工智能
2023/10/11
6850
图片修补 EdgeConnect 论文的阅读与翻译:生成边缘轮廓先验,再填补缺失内容
神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源
拍了一张美美的照片,但是我还不满意。想瘦脸,想按照我想要的弧线瘦脸;还想让眉毛俏皮上挑、鼻子也挺一点。
量子位
2019/04/23
5840
神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源
P图,还是阿逗比厉害(大师加持)
想要变成高手,想要随心所欲的修图,以后可能不需要苦练基本功了,你只需要一个马良那样的神笔。
量子位
2018/07/24
6280
P图,还是阿逗比厉害(大师加持)
女神背心变内衣,只需草图画几笔 | 中山+字节跳动等新研究
前一眼还是金色长发的歪果仁姑娘,在这张图上随意勾勒个帽子形状,下一秒就变成了真实效果,还看不出人为增补痕迹。
量子位
2019/06/19
9050
女神背心变内衣,只需草图画几笔 | 中山+字节跳动等新研究
谷歌Up主自制秃头生成器张东升躺枪,而这款生发GAN让你发际线前进一公里!
想必最近看过《隐秘的角落》的小伙伴们对「张东升」这个人再熟悉不过了。而他洗完澡戴假发的样子成为了不少观众的心理阴影。
新智元
2020/07/14
6990
谷歌Up主自制秃头生成器张东升躺枪,而这款生发GAN让你发际线前进一公里!
论文推荐:基于深度对抗学习的超声图像乳腺肿瘤分割与分类
件GAN (cGAN) + Atrous卷积(AC) +带权重块的通道注意力(CAW)
deephub
2023/01/18
4000
探索生成式对抗网络GAN训练的技术:自注意力和光谱标准化
最近,生成模型引起了很多关注。其中很大以部分都来自生成式对抗网络(GAN)。GAN是一个框架,由Goodfellow等人发明,其中互相竞争的网络,生成器G和鉴别器D都由函数逼近器表示。它们在对抗中扮演不同的角色。
AiTechYun
2018/09/26
1.6K0
探索生成式对抗网络GAN训练的技术:自注意力和光谱标准化
生成对抗网络的发展与挑战
生成对抗网络(Generative adversarial network,GAN)由生成模型和判别模型构成,生成模型获取真实数据的概率分布,判别模型判断输入是真实数据还是生成器生成的数据,二者通过相互对抗训练,最终使生成模型学习到真实数据的分布,使判别模型无法准确判断输入数据的来源。生成对抗网络为视觉分类任务的算法性能的提升开辟了新的思路,自诞生之日起至今已经在各个领域产生了大量变体。
一点人工一点智能
2023/08/25
9640
生成对抗网络的发展与挑战
解读 | 生成人脸修复模型:同时使用两个鉴别器,直接合成逼真人脸
机器之心原创 作者:Liao 参与:Joni、Nurhachu、黄小天 近日,加利福尼亚大学和 Adobe Research 在 arXiv 上联合发表了一篇名为《生成人脸修复(Generative
机器之心
2018/05/07
3.3K0
解读 | 生成人脸修复模型:同时使用两个鉴别器,直接合成逼真人脸
论文推荐 | 生成对抗网络GAN论文TOP 10
我建议你以 DCGAN 这篇论文来开启你的 GAN 之旅。这篇论文展示了卷积层如何与GAN 一起使用,并为此提供了一系列架构指南。这篇论文还讨论了 GAN 特征的可视化、潜在空间插值、利用判别器特征来训练分类器、评估结果等问题。所有这些问题都必然会出现在你的 GAN 研究中。
昱良
2019/07/04
2K0
pix2pix模型(雪花算法原理)
Pix2pix算法(Image-to-Image Translation,图像翻译) 来源于论文:Image-to-Image Translation with Conditional Adversarial Networks
全栈程序员站长
2022/07/28
1.8K0
pix2pix模型(雪花算法原理)
Image-to-Image Translation with Conditional Adversarial Networks超细致解析:使用条件Gan经行图像的转换
像素到像素的预测     每次写一篇都为了自己更深的思考,也希望大家能读懂,一丢丢都不难。这篇论文解决的问题是使用通用框架解决像素到像素的预测,按照从上到下,从做到右说明:上图的第一幅分割街景图恢复成真是街景图,第二幅使用不同颜色的块生成真实建筑,第三幅图是常见的灰度变彩色,第四幅是将空中照片生成地图(谷歌地图),第五幅是图片的风格转移,第六幅图是通过简单的草图生成真实物体。综上,这些任务都是将一张输入图片翻译成另一张
水球喵子
2018/04/10
3.1K0
Image-to-Image Translation with Conditional Adversarial Networks超细致解析:使用条件Gan经行图像的转换
图像恢复系列(11)之修复(inpainting) | 最新ICCV2021生成对抗网络GAN论文梳理汇总
本文提出一种用于图像修复的新型双流网络,以耦合方式进行结构约束的纹理合成,以及纹理引导的结构重建,可以更好地相互利用以获得更合理的生成。此外,为增强全局一致性,设计双向门控特征融合(Bi-GFF)模块来交换和组合结构和纹理信息,并开发上下文特征聚合(CFA)模块。CelebA、Paris StreetView 和 Places2 数据集上的定性和定量实验证明了所提出方法的优越性。
公众号机器学习与AI生成创作
2022/04/09
3.3K0
图像恢复系列(11)之修复(inpainting) | 最新ICCV2021生成对抗网络GAN论文梳理汇总
最强AI人脸技术:一张图像合成动图
本文总结了来自三星莫斯科AI中心和Skolkovo科学技术研究所的研究人员提出的“Few-Shot Adversarial Learning of Realistic Neural Talking Head Models”,该模型的训练基于少量图像(few-shot),可以生成人物头像开口说话的动图。
用户1324186
2019/07/31
5.1K0
【实践】伪造名人的脸—做一个小示例了解生成式对抗网络
生成式对抗网络(GAN)的概念由Ian Goodfellow提出。Goodfellow使用了艺术评论家和艺术家的比喻来描述这两个模型比喻发生器和鉴别,它们组成了GAN。一个艺术评论家(鉴别器)试图判断图像是不是伪造的。一个想愚弄艺术评论家的艺术家(生成器)试图创造一个看起来尽可能真实的伪造的形象。他们“相互斗争”;鉴别器使用生成器的输出作为训练数据,而生成器则从鉴别器中得到反馈。在这个过程中,每个模型都变得更加强大。通过这种方式,GANs能够根据一些已知的输入数据生成新的复杂数据。 实现GAN并不像听起来那
AiTechYun
2018/03/05
1.1K0
【实践】伪造名人的脸—做一个小示例了解生成式对抗网络
学习GAN必须阅读的10篇论文
生成对抗网络是深度学习中最有趣和最受欢迎的应用之一。本文将列出 10 篇关于 GAN 的论文,这些论文详细介绍了 GAN,以及了解最新技术的基础。
磐创AI
2019/05/05
6320
学习GAN必须阅读的10篇论文
无需成对示例、无监督训练,CycleGAN生成图像简直不要太简单
【导读】图像到图像的转换技术一般需要大量的成对数据,然而要收集这些数据异常耗时耗力。因此本文主要介绍了无需成对示例便能实现图像转换的 CycleGAN 图像转换技术。文章分为五部分,分别概述了:图像转换的问题;CycleGAN 的非成对图像转换原理;CycleGAN 的架构模型;CycleGAN 的应用以及注意事项。
AI科技大本营
2019/08/26
2.9K0
无需成对示例、无监督训练,CycleGAN生成图像简直不要太简单
Github项目推荐 | SC-FEGAN:基于GAN的人脸照片涂鸦编辑
(使用用户的草图和颜色进行面部编辑生成对抗网络,可添加/更改耳环,眼镜,发型,酒窝等)
AI研习社
2019/03/14
2.9K0
Github项目推荐 | SC-FEGAN:基于GAN的人脸照片涂鸦编辑
这些老照片如何用算法修复?
这篇文章当中,我将讲述我们如何为老军人的照片创造一个基于AI技术的照片修复项目。 原标题 | AI-Based Photo Restoration 作 者 | Fedor Kitashov 翻 译 |
AI科技评论
2019/08/19
2K0
这些老照片如何用算法修复?
推荐阅读
揭秘2021抖音和快手APP图像修复背后的核心技术,毫无ps痕迹
8070
图片修补 EdgeConnect 论文的阅读与翻译:生成边缘轮廓先验,再填补缺失内容
6850
神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源
5840
P图,还是阿逗比厉害(大师加持)
6280
女神背心变内衣,只需草图画几笔 | 中山+字节跳动等新研究
9050
谷歌Up主自制秃头生成器张东升躺枪,而这款生发GAN让你发际线前进一公里!
6990
论文推荐:基于深度对抗学习的超声图像乳腺肿瘤分割与分类
4000
探索生成式对抗网络GAN训练的技术:自注意力和光谱标准化
1.6K0
生成对抗网络的发展与挑战
9640
解读 | 生成人脸修复模型:同时使用两个鉴别器,直接合成逼真人脸
3.3K0
论文推荐 | 生成对抗网络GAN论文TOP 10
2K0
pix2pix模型(雪花算法原理)
1.8K0
Image-to-Image Translation with Conditional Adversarial Networks超细致解析:使用条件Gan经行图像的转换
3.1K0
图像恢复系列(11)之修复(inpainting) | 最新ICCV2021生成对抗网络GAN论文梳理汇总
3.3K0
最强AI人脸技术:一张图像合成动图
5.1K0
【实践】伪造名人的脸—做一个小示例了解生成式对抗网络
1.1K0
学习GAN必须阅读的10篇论文
6320
无需成对示例、无监督训练,CycleGAN生成图像简直不要太简单
2.9K0
Github项目推荐 | SC-FEGAN:基于GAN的人脸照片涂鸦编辑
2.9K0
这些老照片如何用算法修复?
2K0
相关推荐
揭秘2021抖音和快手APP图像修复背后的核心技术,毫无ps痕迹
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档