前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >图像超分辨率网络中的注意力机制

图像超分辨率网络中的注意力机制

作者头像
deephub
发布于 2021-04-30 06:56:04
发布于 2021-04-30 06:56:04
1.1K0
举报
文章被收录于专栏:DeepHub IMBADeepHub IMBA

图像超分辨率(SR)是一种低层次的计算机视觉问题,其目标是从低分辨率观测中恢复出高分辨率图像。近年来,基于深度卷积神经网络(CNN)的SR方法取得了显著的成功,CNN模型的性能不断增长。近年来,一些方法开始将注意机制集成到SR模型中,如频道注意和空间注意。注意力机制的引入通过增强静态cnn的表示能力,极大地提高了这些网络的性能。

现有研究表明,注意机制在高绩效超划分模型中非常重要。但是很少有研究真正讨论“注意力为什么起作用以及它是如何起作用的”。

今天要介绍的论文试图量化和可视化静态注意力机制,并表明并非所有的注意模块都是有益的。[1]为高精度SR图像提出了注意网络(attention network, A2N)中的注意力。具体来说,A2N由非注意力分支和耦合注意力分支组成。

[1]提出dropout模块(ADM)为两个分支生成动态权值,用于抑制不重要的参数。这使得注意力模块可以更多地关注有益的例子而不受其他惩罚,因此可以通过少量的附加参数来增加注意力模型的容量。

动机

给定输入特征,注意力机制将预测热点图。例如,通道注意将生成1D注意力地图;空间注意力将生成2D注意力地图;频道——空间注意力将生成3D注意力地图。自然而然地,我们问了两个问题:

  • 图像的每个部分的注意力因素是高还是低?
  • 注意力机制是否总是有利于SR模式?

为了回答上面提到的第一个问题,[1]使用了10个注意模块组成的网络,每个模块都使用了通道和空间注意层,所以每个像素都有一个独立的系数。

注意力热点图:由于空间有限,我们选择了几个具有代表性的块,每一栏分别表示第一、第三、第六、第十注意块。第一行:平均输入特征图。第二行:平均输出特征图。第三行:平均注意力地图。对于前两行,特征中的白色区域表示零值,红色区域表示正值,蓝色区域表示负值。对于注意图(第三行),颜色越亮表示系数越高。来源[1]

上图为某些特征与注意图的视觉效果,上表为注意图与高通滤波的相关系数。虽然这种测量方法不能准确测量注意反应,但其目的是量化不同层次之间的相对高通相关性。

每个注意块的注意图与相应特征图的高通滤波器输出特征之间的相关系数。

从上图和上表中可以看出,不同层次学习到的注意力差异很大。例如,模块1和模块10的反应是完全相反的,即低水平注意模块倾向于低频模式,高水平注意模块倾向于高频模式,中间注意模块的反应是混合的。

基于以上发现,[1]提出尽量减少注意力的使用,同时尽量减少附加参数的数量。一个直观的想法是:只将注意力层放在性能关键层中。然而,上述分析并不是衡量注意层有效性的有效解决方案。

为了定量衡量注意层的有效性,[1]提出了注意dropout框架。他们通过关闭特定的注意层进行了一系列的对比实验,结果如下表所示。

从上表可以看出,模块的深度对注意模块的插入位置影响很大。该结果进一步验证了在整个网络中均匀设置注意力是一种次优解决方案。

方法

一种固定的注意力层方案(如RCAN、PANet)被用来同时激活所有的与图像内容无关注意力地图。以上实验表明,注意层的有效性会随着位置的变化而变化。这启发了[1]构造一个非注意短连接分支和一个注意分支,并将它们与动态权重混合在一起。

如图所示,网络架构由三部分组成:

  • 浅层的特征提取
  • 注意块深度特征提取中的注意力
  • 图像重建模块。

输入和输出图像分别表示为ILR和ISR。

在浅层特征提取模块中使用单一的卷积层。然后他们就可以阐明

其中fext(·)是内核大小为3×3的卷积层,从输入LR图像ILR中提取浅层特征,x0是提取的特征图。他们利用A2B构造了一个链子网络作为深度特征提取器。

其中,fA2B(·)表示我们在注意块中的建议。A2B将无注意力的分支和注意力分支结合起来并动态调整权重。

在深度特征提取后,通过重构模块对深度特征xn进行升级。在重构模块中,首先使用最近邻插值进行上采样,然后在两个卷积层之间使用一个简化的通道-空间注意层。

他们受到动态内核的启发,提出了一个可学习的ADM来自动丢弃一些不重要的注意力特性,并平衡注意力分支到非注意力分支。具体来说,每个ADM都采用加权方法来控制注意力分支和非注意力分支的动态加权贡献。

如上图所示,注意dropout模块通过使用其块的相同输入特征作为两个独立分支来生成权重。

在形式上,我们有:

其中x^{na}_ n为非注意力分支的输出,x^{att}_ n为注意力分支的输出。F_ {1×1}(·)提供1×1核卷积。π^{na}和π^{att}分别为非注意力分支和注意力分支的权值,由网络根据输入特征计算π^{na}和π^{att},而不是人为设置的两个固定值。为了计算动态权值,我们有:

其中f_drop(·)是注意力丢弃模块。

注意力丢弃模块可以在上面的图中详细查看。它首先使用全局平均池化压缩输入xn−1。连接层由两个完全连接的层组成,使用ReLU激活。它们使用全局池化来增加接受域,这使得注意力退出模块能够从整个图像中捕获特征。

结论

实验结果表明,该模型与目前最先进的轻量级网络相比,具有更好的权衡性能。局部归因图的实验也证明注意(A2)结构中的注意可以从更广泛的范围内提取特征。

论文

1.Haoyu Chen, Jinjin Gu, Zhi Zhang.Attention in Attention Network for Image Super-Resolution,arXiv:2104.09497

本文作者:Nabil MADALI

原文地址:https://medium.com/@nabil.madali/attention-in-attention-network-for-image-super-resolution-60f9726f0bbc

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-04-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DeepHub IMBA 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
华为OD机试 内存池
有一个简易内存池,内存按照大小粒度分类,每个粒度有若干个可用内存资源。 用户橡皮擦会进行一系列内存申请,需要按需分配内存池中的资源,返回申请结果成功失败列表。
梦想橡皮擦
2023/04/07
6530
华为OD机试 IPv4 地址转换成整数
存在一种虚拟 IPv4 地址,由4小节组成,每节的范围为0~255,以#号间隔, 虚拟 IPv4 地址可以转换为一个32位的整数,例如: 128#0#255#255,转换为32位整数的结果为2147549183(0x8000FFFF) 1#0#0#0,转换为 32 位整数的结果为16777216(0x01000000) 现以字符串形式给出一个虚拟 IPv4 地址,限制第1小节的范围为1~128, 即每一节范围分别为(1~128)#(0~255)#(0~255)#(0~255), 要求每个 IPv4 地址只能对应到唯一的整数上。 如果是非法 IPv4,返回invalid IP
梦想橡皮擦
2023/04/11
5650
华为OD机试 获得完美走位
在第一人称射击游戏中,玩家通过键盘的A、S、D、W四个按键控制游戏人物分别向左、向后、向右、向前进行移动,从而完成走位。 假设玩家每按动一次键盘,游戏人物会向某个方向移动一步,如果玩家在操作一定次数的键盘并且各个方向的步数相同时,此时游戏人物必定会回到原点,则称此次走位为完美走位。 现给定玩家的走位(例如:ASDA),请通过更换其中一段连续走位的方式使得原走位能够变成一个完美走位。 其中待更换的连续走位可以是相同长度的任何走位。 请返回待更换的连续走位的最小可能长度。 若果原走位本身是一个完美走位,则返回0。
梦想橡皮擦
2023/04/07
6700
华为OD机试 不等式
例如:不等式组: a11*x1+a12*x2+a13*x3+a14*x4+a15*x5<=b1; a21*x1+a22*x2+a23*x3+a24*x4+a25*x5<=b2; a31*x1+a32*x2+a33*x3+a34*x4+a35*x5<=b3;
梦想橡皮擦
2023/04/11
3610
华为OD机试 九宫格按键输入
九宫格按键输入,有英文和数字两种模式, 默认是数字模式,数字模式直接输出数字, 英文模式连续按同一个按键会依次出现这个按键上的字母, 如果输入/或者其他字符,则循环中断,输出此时停留的字母。 数字和字母的对应关系如下,注意0只对应空格:
梦想橡皮擦
2023/04/08
5760
好朋友 huawei od 机试
在学校中 N个小朋友站成一队 第i个小朋友的身高为height[i] 第i个小朋友可以看到第一个比自己身高更高的小朋友j 那么j是i的好朋友 (要求:j > i) 请重新生成一个列表 对应位置的输出是每个小朋友的好朋友的位置 如果没有看到好朋友 请在该位置用0代替 小朋友人数范围 0 ~ 40000
梦想橡皮擦
2023/04/08
3190
华为OD机试 统计匹配的二元组个数
给定两个数组 A 和 B,若数组 A 的某个元素 A[i] 与数组 B 中的某个元素 B[j] 满足 A[i]==B[j],则寻找到一个匹配的二元组(i,j) ,请统计再这两个数组 A 和 B 中,一共存在多少个这样的二元组。
梦想橡皮擦
2023/04/07
5200
本期题目:新员工座位安排系统
刷题技巧 我这里有一个“刷题技巧”,你可以看看,或许可以帮到你: 不要盲目的刷题,凡是讲究策略与技巧,题型是有限的。用自己的方法梳理题型,归纳与总结,就能举一反三、手到擒来。 这个“刷题技巧”,包含了递归、分治、单调栈、并查集、滑动窗口、前缀和、查分、二分查找、 BFS 广搜和 DFS 深搜。 这些题型,都有一些共同点: 递归,都是用一组关键字来实现 BFS 广搜和 DFS 深搜的共同点: 前缀和(前缀法):通过判断值是否相等来判断结果是否为 1。若不相等则返回 1 (否则返回 0)。(也可以通过数组索引的方法) BFS 广搜的共同点:利用数组索引的方法。
梦想橡皮擦
2023/04/08
4150
本期题目:新员工座位安排系统
华为OD机试 字符匹配
给你一个字符串数组 每个字符串均由小写字母组成 和一个字符规律 由小写字母和.和*组成 识别字符串数组中哪些字符串可以匹配到字符规律上 . 匹配任意单个字符 * 匹配 0 个或多个任意字符 判断字符串是否匹配,是要涵盖整个字符串的而不是部分字符串
梦想橡皮擦
2023/04/08
6090
华为OD机试 本期题目:VLAN 资源池
Vlan是一种为局域网设备进行逻辑划分的技术 为了标识不同的vlan 引入了vlan id: 1 ~ 4094之间的整数 定义一个vlan id 的资源池 资源池中连续的vlan用开始vlan-结束vlan表示, 不连续的用单个整数表示 所有的vlan用英文逗号连接起来 现有一个vlan资源池,业务需要从资源池中申请一个vlan 需要你输出从vlan资源池中移除申请的vlan后的资源池
梦想橡皮擦
2023/05/01
4200
华为OD机试 相对开音节
相对开音节构成的结构为辅音+元音(aeiou)+辅音(r除外) 常见的单词有bike cake 给定一个字符串,以空格为分隔符 反转每个单词的字母 若单词中包含如数字等其他非字母时不进行反转 反转后计算其中含有相对开音节结构的子串个数 (连续子串中部分字符可以重复)
梦想橡皮擦
2023/04/13
3640
华为OD机试 删除最少字符
今年大环境不好,投递简历没得到回复,只有华为 OD 和几个外包公司联系上。机试分三道编程题,满分 400 分,150 分及格,分数越高推荐的部门越多。性格测试 50 道选择题,前后答案需一致,尽量往积极阳光方向靠拢。技术一面问八股文和基础 SQL 优化、索引等,手撕编程题。技术二面问项目经验和实现细节,手撕中等难度编程题。主管面和 HR 资面询问工作时间和离职原因,谈薪资。整个面试过程持续约 2 周,最终通过。虽然机试分数不到 300 分,但面试官在技术二面给笔者更多机会,使面试时间超过了 90 分钟。虽然 OD 待遇不比其他公司高多少,但筛选出优秀人才的目的促使笔者参加面试。
梦想橡皮擦
2023/04/21
2740
华为OD机试 数组组成的最小数字
参加华为 od 机试,一定要注意不要完全背诵代码,需要理解之后模仿写出,通过率才会高。
梦想橡皮擦
2023/05/01
4980
华为OD机试 最左侧冗余覆盖子串
给定两个字符串s1和s2和正整数K,其中s1长度为n1,s2长度为n2, 在s2中选一个子串,满足:
梦想橡皮擦
2023/04/21
3520
华为OD机试 重组字符串
给定一个非空字符串 S,其被 N 个‘-’分隔成 N+1 的子串,给定正整数 K, 要求除第一个子串外,其余的子串每 K 个字符组成新的子串,并用‘-’分隔。 对于新组成的每一个子串,如果它含有的小写字母比大写字母多,则将这个子串的所有大写字母转换为小写字母; 反之,如果它含有的大写字母比小写字母多,则将这个子串的所有小写字母转换为大写字母; 大小写字母的数量相等时,不做转换。
梦想橡皮擦
2023/03/31
3710
华为机试 剩余可用字符集 or @分割可用字符集
参加华为 od 机试,一定要注意不要完全背诵代码,需要理解之后模仿写出,通过率才会高。
梦想橡皮擦
2023/05/02
3710
华为OD机试 TLV [Tag Length Value] 编码
TLV 编码是按 TagLengthValue 格式进行编码的。 一段码流中的信元用tag标识,tag在码流中唯一不重复, length表示信元value的长度,value表示信元的值, 码流以某信元的tag开头,tag固定占一个字节,length固定占两个字节,字节序为小端序。 现给定tlv格式编码的码流以及需要解码的信元tag,请输出该信元的value。
梦想橡皮擦
2023/04/21
9660
华为OD机试真题 分苹果
参加华为 od 机试,一定要注意不要完全背诵代码,需要理解之后模仿写出,通过率才会高。
梦想橡皮擦
2023/05/01
7150
华为OD机试 简易压缩算法
有一种简易压缩算法:针对全部为小写英文字母组成的字符串,将其中连续超过两个相同字母的部分压缩为连续个数加该字母,其他部分保持原样不变。 例如字符串aaabbccccd 经过压缩变成字符串 3abb4cd 请您编写解压函数,根据输入的字符串, 判断其是否为合法压缩过的字符串 若输入合法则输出解压缩后的字符串 否则输出字符串!error来报告错误
梦想橡皮擦
2023/04/21
3710
华为OD机试 卡片组成的最大数字
小组中每位都有一张卡片 卡片是6位以内的正整数 将卡片连起来可以组成多种数字 计算组成的最大数字
梦想橡皮擦
2023/04/07
5940
相关推荐
华为OD机试 内存池
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档