Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >CVPR2022 | 浙大、蚂蚁集团提出基于标签关系树的层级残差多粒度分类网络,建模多粒度标签间的层级知识

CVPR2022 | 浙大、蚂蚁集团提出基于标签关系树的层级残差多粒度分类网络,建模多粒度标签间的层级知识

作者头像
机器之心
发布于 2022-06-29 08:49:06
发布于 2022-06-29 08:49:06
1.3K0
举报
文章被收录于专栏:机器之心机器之心

机器之心专栏

作者:蚂蚁集团-大安全-数字身份及安全生态、浙江大学

来自浙江大学和蚂蚁集团 - 大安全 - 数字身份及安全生态的研究者提出了一种基于标签关系树的层级残差多粒度分类网络 HRN。

基于有监督式深度学习图像识别任务中一个方面要求是构建整理大规模、高质量的标注数据,这就对图像质量和标注人员的背景知识有比较高的要求。例如,在细粒度分类任务中,标注人员需要依赖大量的领域知识去区分各种种类的鸟以及不同型号的舰船,如图 1 所示。

图 1: 不同种类的信天翁以及不同型号的航母

在图 1 中,标注人员需要借助鸟类专家的知识才能辨认黑脚信天翁与黑背信天翁,拥有一般鸟类知识的人员或许会将这两种鸟类归类为信天翁,而缺乏鸟类知识的人员可能只会将这两种鸟类归类为鸟。类似地,标注人员需要借助军事舰船专家的知识才能有效区分尼米兹级航母与企业级航母,而缺乏相关背景知识的人员可能会将这两类舰船归类为航母。也就是说,同一张图片会被拥有不同背景知识的标注人员标注到不同层级粒度的类别上。

除了背景知识对标注产生的影响,诸如鸟类辨别中的关键区域被遮挡、图像分辨率较低、或者图像比较模糊等图像质量因素也会干扰标注人员对于图像目标属于层级多粒度标签中的哪一类的判断,如图 2 所示。

图 2: 由于遮挡、分辨率等图像质量的变化与专家背景知识的差异,导致目标可能被标注到不同层级上

但是,传统的图像识别数据集类别设定中,针对某个特定任务例如通用图像分类任务或者细粒度分类任务,类别标签往往只位于同一层级中,无法鲁棒地利用标注到不同层级上的图片,对标注的要求较高。为了降低图像质量以及背景知识等带来的对标注数据的高要求、充分利用具有不同层级粒度标签的样本,设计建模目标层级语义结构的层级多粒度识别算法对于提升深度神经网络的鲁棒性具有十分重要的作用。为此,浙江大学联合蚂蚁集团提出了一种基于标签关系树的层级残差多粒度分类网络,收录到 CVPR2022 中。

  • 论文地址:https://openaccess.thecvf.com/content/CVPR2022/papers/Chen_Label_Relation_Graphs_Enhanced_Hierarchical_Residual_Network_for_Hierarchical_Multi-Granularity_CVPR_2022_paper.pdf
  • 代码地址:https://github.com/MonsterZhZh/HRN

算法介绍

我们从三点观察出发构建我们的层级多粒度分类算法:(1)由于细粒度类别可以根据不同层次的抽象向上不停迭代归类形成树形类别结构,我们构建对应的标签关系树建模层级类别间的语义关系;(2) 基于标签关系树设计复合损失函数,使得具有不同层级粒度标注的样本在学习时可以传递层级间的知识;(3)现实世界中位于低层级的子类除了拥有自己的独特属性还会进一步继承来自父类的属性,我们首先为每个层级设置专有的特征提取层,根据主干网 络输出的特征提取各个层级相关的特征。然后我们参考深度残差网络中经典的残差连接 设计,实现为所有父类层级的特征以残差连接的方式融合到子类层级专有的特征中,进而用于当前层级类别分类的层级残差网络(HRN)。 

标签关系树

标签关系树

由节点集合

、有向边集合

、以及无向边集合

组成。每个节点

对应到层级中的一个类别标签,图中的节点个数 n 等于层级中所有标签的个数。一条有向边

代表节点

间具有父子关系,及类别 i 是类别 j 的父类。一条无向边

代表节点

为互斥关系。层级中每个类别标签取值为二元值,即

,代表目标是否具有这个类别标签。图中每条边限制了相连节点的取值:对于具有父子关系边相连的两个节点

的赋值是违法的(是拉布拉多却不是狗);对于具有互斥关系边相连的两个节点

的赋值是违法的(既是柯基又是拉布拉多)。图中所有边约束了层级多标签中相邻类别节点的合法取值,对于层级中所有标签的一个全局合法赋值为一个二元标签向量

。所有全局合法赋值向量的集合构成标签关系树 G 拥有的合法赋值空间

层级残差网络

图 3: 层级残差网络结构图

基于残差跨层级连接的层级残差网络 (HRN) 由一个主干特征提取网络、层级特征 交互模块、以及两个并行的输出通道构成,如图 3 所示。任何常用的网络都可以作为主干网络用来提取输入图像的特征,我们选用广泛使用的深度残差网络 ResNet-50 作为 HRN 网络的主干网络。层级特征交互模块包括每个层级专有的特征提取层与残差连接部分。层级专有特征提取层网络结构一致,都包含两层卷积层后接两层全连接层 (FC)。层级专有特征提取层根据主干网络产生的共享输入特征提取每个层级专有的特征。残差连接部分首先线性组合来自粗粒度父类层级的特征与细粒度子类层级的特征,反映子类不仅具有属于自己的独特属性还继承了来自父类的属性。父类层级专有特征提取层可以视为残差连接将属于自己层级的特征逐层向下结合到子类层级的特征中。

然后,我们对组合后的特征应用非线形变换(ReLU) 后送入后续网络层。网络最后依然设置两路并行的输出通道。第一路输出通道用来基于标签关系树计算概率分类损失函数,通道中的 sigmoid 节点一一对应层级中的每个类别标签,所有 sigmoid 节点按照标签关系树进行组织。第二路输出通道中的 softmax 节点对应最后一层级中彼此互斥的细粒度类别,形成多类交叉熵损失函数让网络在优化时关注细粒度分类的误差。 

复合损失函数

给定一幅输入图像

通道中对应赋值向量的所有 sigmoid 节点的联合输出概率可以计算为:

,代表层级中第 i 个节点的 sigmoid 输出

,代表由标签关系树定义的层级约束

用作概率归一化,求和标签关系树上所有的合法赋值

如果输入图像 x 被标注到树中的第 i 个标签上,即

,我们可以计算标签 i 的边缘概率:

分析边缘概率的计算公式,我们可以发现:(1)图中某个标签 的边缘概率依赖于该标签所有的父类节点分数值之和,因为该标签赋值为 1 则其所有的 父节点都应该赋值 1 才能满足层级约束关系。因此,边缘概率的计算可以使得父节点的 分数值影响子节点的预测值。(2)计算层级中间标签的边缘概率时需要包含其所有子类标签对应的联合概率,即可以聚集来自子类的知识。最后,给定 m 个训练样本

,我们最大似然边缘概率得到概率分类损失函数:

代表赋值的标签向量,

为标注到标签关系树中的标签下标。

为了进一步加强网络对于细粒度叶子节点的区分能力,我们进一步结合多类交叉熵损失函数,形成最后的复合损失函数优化整个网络:

即根据样本是否被标注叶子节点,选择性地结合交叉熵损失函数与概率分类损失函数。

实验

数据集

我们在常用的三套细粒度分类数据集:CUB-200-2011、FGVC-Aircraft、Stanford Cars。依据维基百科为每个数据集设定层级标签关系树,其中 CUB-200-2011 包含 38 orders, 38 families, 200 species 三个层级;FGVC-Aircraft 具有 30 makers, 70 families, 100 models 三个层级;以及 Stanford Cars 具有 9 car types, 196 car makers 两个层级。

实验指标

我们采用两套实验指标进行评价:衡量每个层级的准确率(OA)以及层级分类中的常用指标

,即首先计算各个类别上平均的 precision-recall (PRC)曲线,通过某个阈值,获得平均 PRC 曲线中的一点

通过设定不同的阈值得到平均 PRC 曲线,

为平均 PRC 曲线下的面积。

实验设计

我们模拟现实世界中存在的两点限制:(1)模拟主观专家知识的差异:将位于细粒度叶子类别中的样本,选取其中 0%,30%,50%,,70% 以及 90% 的样本,重新标记到其对应的父类标签;(2)模拟图像质量的影响:将选取的重标记样本进一步降低其图像的分辨率。

消融实验

在表 1 中我们验证了层级残差网络中包含的层级专有特征提取层(GSB)、层级特征线性组合(LC)、以及针对组合后的层级特征的非线性变换(ReLU)各部分的作用:

表 1:通过逐步添加 HRN 网络中的关键部分: 层级专有特征提取层 (granularity-specific block, GSB)、层级间特征的线性组合(linear combination, LC)、以及最后对于组合特征的非线形变换 (ReLU) 获得 CUB-200-2011 数据集中最后一层级上对应重标记比例为 0% 的 OA(%) 实验结果。

在表 2 中我们验证了复合损失函数中多类交叉熵损失函数的作用:

表 2: 不同重标记比例下验证概率分类损失函数

与多类交叉熵损失函数

的结合效果,汇报 CUB-200-2011 数据集中最后一层级上的 OA(%) 实验结果

在表 3 中我们对比了复合损失函数与传统的层级分类损失函数对比的结果:

表 3:CUB-200-2011 数据集中最后一层级上重标记比例为 0% 对比复合损失函数与传统层级分类损失函数的 OA(%) 实验结果

在图 4 中我们利用 Grad-Cam 可视化算法展示各个层级响应的二维激活热力图:

图 4: 鸟类数据集上来自同一目 (order: Passeriformes) 同一科 (family: Troglodytidae) 下面两种 种类 (species: House Wren 与 Marsh Wren) 的鸟类图片上,我们方法产生的二维激活热力图 

对比实验

我们对比了 4 种公认的层级多粒度分类方法:HMC-LMLP[1] 、HMCN[2]、Chang et al.[3]、C-HMCNN[4]。我们汇总平均在各个数据集、不同重标记比例下各个对比方法的 OA / 结果在表 4 中:

表 4: 在各个数据集、不同重标记比例下对比方法的平均 OA / 结果

类似地,我们利用 Grad-Cam 算法展示各个对比方法在不同层级上的二维激活热力图,结果见图 5:

图 5: CUB-200-2011 数据集中来自同一目 (order: Passeriformes) 同一科 (family: Troglodytidae) 下面两种种类(左边: House Wren,右边: Marsh Wren) 的鸟类图片上,不同对比方法在三层层级 上各自的感兴趣响应区域示例

参考文献

[1]Ricardo Cerri, et al. Reduction strategies for hierarchical multi-label classification in protein function prediction. BMC Bioinformat., 17(1):373, 2016.

[2]Jonatas Wehrmann, Ricardo Cerri, and Rodrigo Barros. Hierarchical multi-label classification networks. ICML, 2018.

[3]Dongliang Chang, et al. Your” flamingo” is my” bird”: Fine-grained, or not. CVPR, 2021.

Eleonora Giunchiglia and Thomas Lukasiewicz. Coherent hierarchical multi-label classification networks. NeurIPS, 2020.

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-06-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
ACNet: 特别的想法,腾讯提出结合注意力卷积的二叉神经树进行细粒度分类 | CVPR 2020
论文: Attention Convolutional Binary Neural Tree for Fine-Grained Visual Categorization
VincentLee
2020/03/06
7820
学界 | 微软亚洲研究院CVPR 2017 Oral论文:逐层集中Attention的卷积模型
选自CVPR 2017 机器之心编译 参与:Smith、路雪、蒋思源 通过计算机视觉方法识别纹理细密的物体种类已经受到了学界的强烈关注。这一类任务往往是极具挑战性的,这是因为一些纹理细密的物体种类只能被该领域的专家所识别出来。与一般的识别不同,细粒度图像识别(fine-grained image recognition)是应该能够进行局部定位(localizing),并且能在其从属(subordinate)类别中表征很小的视觉差异的,从而使各种应用受益,比如专家级的图像识别、图像标注等等。 微软亚洲研究院梅
机器之心
2018/05/09
1.1K0
学界 | 微软亚洲研究院CVPR 2017 Oral论文:逐层集中Attention的卷积模型
【图像分类】细粒度图像分类是什么,有什么方法,发展的怎么样
欢迎大家来自《图像分类》专栏,今天讲述细粒度图像分类问题,这是计算机视觉领域一项极具挑战的研究课题,本文介绍了细粒度图像分类算法的发展现状、相关数据集和竞赛,供大家参考学习。
用户1508658
2019/07/30
3.4K0
【图像分类】细粒度图像分类是什么,有什么方法,发展的怎么样
《AFTrans》来自ViT的免费午餐!北大&阿里提出用于细粒度视觉识别的自适应注意多尺度融合Transformer
本文分享论文『A free lunch from ViT- Adaptive Attention Multi-scale Fusion Transformer for Fine-grained Visual Recognition』,被称为来自 ViT 的免费午餐!由北大&阿里提出用于细粒度视觉识别的自适应注意多尺度融合Transformer:《AFTrans》。
CV君
2022/01/20
9300
《AFTrans》来自ViT的免费午餐!北大&阿里提出用于细粒度视觉识别的自适应注意多尺度融合Transformer
细粒度图像分析_图像分类研究现状
Awesome Fine-grained Visual Classification Awesome Fine-Grained Image Analysis – Papers, Codes and Datasets—-weixiushen
全栈程序员站长
2022/11/09
1.2K0
细粒度图像分析_图像分类研究现状
ACM MM | 中山大学等提出HSE:基于层次语义嵌入模型的精细化物体分类
作者:Tianshui Chen、Wenxi Wu、Yuefang Gao、Le Dong、Xiaonan Luo、Liang Lin
机器之心
2018/09/20
9030
ACM MM | 中山大学等提出HSE:基于层次语义嵌入模型的精细化物体分类
有效捕捉目标级别语义信息,之江实验室&浙大提出再注意机制TRT
机器之心专栏 机器之心编辑部 来自之江实验室和浙江大学的研究者提出了一种再注意机制,旨在更有效地捕捉目标级别的语义信息,抑制背景干扰,实现更准确的目标定位能力。 弱监督定位任务(Weakly supervised object localization, WSOL)仅利用图像级别的类别标签,就能实现目标级别的定位功能,因为其细粒度注释的最小化需求大大压缩了人工成本,于近年获得大量关注。 由于缺乏目标级别标签的约束,仅利用图像标签进行分类训练,弱监督定位方法往往倾向于只定位图像中最具判别性的局部区域,难以涵盖
机器之心
2022/08/25
3120
有效捕捉目标级别语义信息,之江实验室&浙大提出再注意机制TRT
字节跳动获CVPR2021 细粒度图像竞赛双料冠军
当我们还对玫瑰、月季和蔷薇傻傻分不清楚的时候,计算机视觉已经可以在一万种极其相似的自然界物种里精确地分门别类了。
量子位
2021/07/19
8150
AAAI 2020 | 自动化所:基于对抗视觉特征残差的零样本学习方法
本文对中科院自动化所胡占义团队完成,被AAAI-20录用的论文《Zero-Shot Learning from Adversarial FeatureResidual to Compact Visual Feature》进行解读。
AI科技评论
2020/02/13
7560
见微知著:细粒度图像分析进展
作者简介:魏秀参,南京大学计算机系机器学习与数据挖掘所(LAMDA)博士生,专攻计算机视觉和机器学习。曾在国际顶级期刊和会议发表多篇学术论文,并两次获得国际计算机视觉相关竞赛冠亚军。 责编:何永灿,欢迎人工智能领域技术投稿、约稿、给文章纠错,请发送邮件至heyc@csdn.net 本文为《程序员》原创文章,未经允许不得转载,更多精彩文章请订阅2017年《程序员》 有别于通用图像分析任务,细粒度图像分析的所属类别和粒度更为精细,它不仅能在更细分的类别下对物体进行识别,就连相似度极高的同一物种也能区别开来。
用户1737318
2018/06/06
1.6K0
检测技术再进化:人物交互检测,基于多层次条件网络的方法(ICMR2020)
https://dl.acm.org/doi/abs/10.1145/3372278.3390671
CV君
2022/03/16
1.3K0
检测技术再进化:人物交互检测,基于多层次条件网络的方法(ICMR2020)
CVPR 2022 | 大幅减少零样本学习所需的人工标注,马普所和北邮提出富含视觉信息的类别语义嵌入
来源:机器之心本文约2900字,建议阅读10+分钟VGSE模型能够发掘与人工标注属性互补的视觉特征。 来自北京邮电大学、马普所等机构的研究者提出了类别嵌入发掘网络,提高了类别嵌入在视觉空间的完备性,对零样本学习中类别之间的知识转移有重要促进作用。 零样本学习旨在模仿人类的推理过程,利用可见类别的知识,对没有训练样本的不可见类别进行识别。类别嵌入(class embeddings)是描述类别语义和视觉特征的向量,能够实现知识在类别间的转移,因而在零样本学习中发挥着不可替代的作用。 零样本分类图解 如上图所示
数据派THU
2022/07/12
4040
CVPR 2022 | 大幅减少零样本学习所需的人工标注,马普所和北邮提出富含视觉信息的类别语义嵌入
【图像分类】 基于Pytorch的细粒度图像分类实战
针对传统的多类别图像分类任务,经典的CNN网络已经取得了非常优异的成绩,但在处理细粒度图像数据时,往往无法发挥自身的最大威力。
用户1508658
2019/08/13
1.9K0
CVPR 2022 | 大幅减少零样本学习所需的人工标注,马普所和北邮提出富含视觉信息的类别语义嵌入
机器之心专栏 作者:北京邮电大学、马普所 来自北京邮电大学、马普所等机构的研究者提出了类别嵌入发掘网络,提高了类别嵌入在视觉空间的完备性,对零样本学习中类别之间的知识转移有重要促进作用。 零样本学习旨在模仿人类的推理过程,利用可见类别的知识,对没有训练样本的不可见类别进行识别。类别嵌入(class embeddings)是描述类别语义和视觉特征的向量,能够实现知识在类别间的转移,因而在零样本学习中发挥着不可替代的作用。 零样本分类图解 如上图所示,由于属性(attributes)能够被不同类别共享,促进了
机器之心
2022/06/29
5020
CVPR 2022 | 大幅减少零样本学习所需的人工标注,马普所和北邮提出富含视觉信息的类别语义嵌入
改进视觉-语言概念瓶颈模型中的概念匹配 !
概念瓶颈模型(CBM)[14]是构建具有高级概念的可解释模型的一种流行选择。这些模型首先将输入图像映射到一个低维的(因此有“瓶颈”一词)专家定义的概念空间,其中每个概念都可以被人类容易理解。例如,朱红捕蝇鸟这一鸟类物种可以有“红色身体”、“黑色翅膀”和“红色冠”等概念。然后,一个线性分类器在这些概念之上进行类别预测。构建CBM有两个基本要求:一个定义良好的、无歧义的概念集以及每个样本的相应概念标签。近期的方法[25, 46]通过利用大型语言模型(LLM)和视觉语言模型(VLM)来自动化上述步骤,并将CBM扩展到更大的数据集(如ImageNet)。它们通常涉及通过用少量样本提示LLM来生成一个初始概念集,然后提取那些有利于区分(分类)的概念子集。当图像和这个经过筛选的概念集3作为输入传递给经过对比预训练的VLM时,其图像-文本对齐分数作为该样本的“概念分数或概念标签”。这些概念标签可以用来训练另一个CBM分类器,或者直接用来预测类别,从而将VLM转变为CBM(从此处起称为VL-CBM)。尽管LLM拥有丰富的世界知识,并且可以在任何领域生成潜在的(大量)概念集,但在某些情况下,专家定义的概念更为合适。
AIGC 先锋科技
2024/08/19
2200
改进视觉-语言概念瓶颈模型中的概念匹配 !
CVPR 2018 | 新型语义分割模型:动态结构化语义传播网络DSSPN
选自arXiv 作者:Xiaodan Liang、Hongfei Zhou、Eric Xing 机器之心编译 参与:乾树、路雪 近日,来自 CMU、Petuum 等机构的研究者提出一种新型语义分割模型动态结构化语义传播网络 DSSPN,通过将语义概念层次明确地结合到网络中来构建语义神经元图。实验证明 DSSPN 优于当前最优的分割模型。 引言 随着卷积神经网络的不断进步,目标识别和分割作为计算机视觉的主要研究方向取得了巨大的成功。然而,目前使用更深、更宽网络层的分割模型 [24,5,40,37,22] 在对
机器之心
2018/05/08
1K0
CVPR 2018 | 新型语义分割模型:动态结构化语义传播网络DSSPN
7 Papers & Radios | 机器人顶会RSS最佳论文;谷歌用语言模型解数学题
机器之心 & ArXiv Weekly Radiostation 参与:杜伟、楚航、罗若天 本周重要论文包括:RSS 2022 和 NAACL 2022 各项获奖论文。 目录: Solving Quantitative Reasoning Problems with Language Models  Human Action Recognition from Various Data Modalities: A Review FNet: Mixing Tokens with Fourier Transfor
机器之心
2022/07/04
4770
7 Papers & Radios | 机器人顶会RSS最佳论文;谷歌用语言模型解数学题
17篇入选CVPR 2020,腾讯优图 9 篇精选论文详解
全球计算机视觉顶级会议CVPR2020 (IEEE Conference on Computer Vision and Pattern Recognition,即IEEE国际计算机视觉与模式识别会议) 即将于2020年6月14日-19日在美国西雅图召开。
AI科技评论
2020/03/10
1.1K0
17篇入选CVPR 2020,腾讯优图 9 篇精选论文详解
CVPR 2022 Oral | 大连理工提出小样本识别DeepBDC,6项基准性能最好
机器之心专栏 作者:谢江涛、龙飞、吕佳铭、王旗龙、李培华 在本文中,来自大连理工大学等机构的研究者提出了 DeepBDC 用于小样本分类任务,DeepBDC 通过度量样本对之间的联合分布从而获得更准确的相似度,极大的提升了小样本分类的性能。论文已被 CVPR 2022 接收为 Oral Presentation。 本文首次将布朗距离协方差这一基于概率和统计的相似性度量引入到深度学习中,提出了一种端到端的小样本识别方法 DeepBDC。所提出的方法在包括一般目标识别、细粒度分类和跨域分类等任务的 6 个标准数
机器之心
2022/04/24
9160
CVPR 2022 Oral | 大连理工提出小样本识别DeepBDC,6项基准性能最好
学界 |「分段映射」帮助利用少量样本习得新类别细粒度分类器
作者:Xiu-Shen Wei等 机器之心编译 参与:Pedro、路 近日,来自南京大学、旷视和阿德莱德大学的研究者在 arXiv 上发布论文,提出一种利用少量样本学习新类别细粒度分类器的新方法 FSFG 模型,该方法包含两个模块:双线性特征学习模块和分类器映射模块。后者中的「分段映射」功能是该模型的关键部分,它通过一种参数更少的方式学习一组相对易实现的子分类器,进而生成决策边界。 细粒度图像识别是一个重要的计算机视觉问题。得益于复杂深层网络结构的应用,该问题解决方案的表现也越来越好。训练这种分类算法所需
机器之心
2018/06/12
1.2K0
推荐阅读
ACNet: 特别的想法,腾讯提出结合注意力卷积的二叉神经树进行细粒度分类 | CVPR 2020
7820
学界 | 微软亚洲研究院CVPR 2017 Oral论文:逐层集中Attention的卷积模型
1.1K0
【图像分类】细粒度图像分类是什么,有什么方法,发展的怎么样
3.4K0
《AFTrans》来自ViT的免费午餐!北大&阿里提出用于细粒度视觉识别的自适应注意多尺度融合Transformer
9300
细粒度图像分析_图像分类研究现状
1.2K0
ACM MM | 中山大学等提出HSE:基于层次语义嵌入模型的精细化物体分类
9030
有效捕捉目标级别语义信息,之江实验室&浙大提出再注意机制TRT
3120
字节跳动获CVPR2021 细粒度图像竞赛双料冠军
8150
AAAI 2020 | 自动化所:基于对抗视觉特征残差的零样本学习方法
7560
见微知著:细粒度图像分析进展
1.6K0
检测技术再进化:人物交互检测,基于多层次条件网络的方法(ICMR2020)
1.3K0
CVPR 2022 | 大幅减少零样本学习所需的人工标注,马普所和北邮提出富含视觉信息的类别语义嵌入
4040
【图像分类】 基于Pytorch的细粒度图像分类实战
1.9K0
CVPR 2022 | 大幅减少零样本学习所需的人工标注,马普所和北邮提出富含视觉信息的类别语义嵌入
5020
改进视觉-语言概念瓶颈模型中的概念匹配 !
2200
CVPR 2018 | 新型语义分割模型:动态结构化语义传播网络DSSPN
1K0
7 Papers & Radios | 机器人顶会RSS最佳论文;谷歌用语言模型解数学题
4770
17篇入选CVPR 2020,腾讯优图 9 篇精选论文详解
1.1K0
CVPR 2022 Oral | 大连理工提出小样本识别DeepBDC,6项基准性能最好
9160
学界 |「分段映射」帮助利用少量样本习得新类别细粒度分类器
1.2K0
相关推荐
ACNet: 特别的想法,腾讯提出结合注意力卷积的二叉神经树进行细粒度分类 | CVPR 2020
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档