论文地址: http://arxiv.org/pdf/2008.05676v1.pdf
代码: https://github.com/jialianw/forest_rcnn
来源: 纽约州立大学布法罗分校,天津大学,Horizon Robotics
论文名称:Forest R-CNN Large-Vocabulary Long-Tailed Object Detection and Instance Segmentation
原文作者:Jialian Wu
内容提要
尽管之前的目标分析是成功的,但是用长尾数据分布来检测和分割大量的目标类别仍然是一个具有挑战性的问题,研究较少。对于一个大词汇量的分类器,得到有噪声日志的概率非常高,这很容易导致错误的识别。在本文中,利用目标类别之间关系的先验知识,将fne-grained聚类到较粗的父类中,并构造一个分类树,该树负责通过对象实例的父类将其解析为fne-grained。在分类树中,由于父类节点的数量显著减少,其日志的噪声较小,可用于抑制fne-grained节点中存在的错误/噪声日志。由于构造父类的方法不是唯一的,我们进一步构建多个树来形成一个分类森林,其中每棵树都为fne-grained的分类做出贡献。为了缓解长尾现象造成的学习不平衡,我们提出了一种简单有效的重采样方法——NMS重采样,来重新平衡数据分布。本文方法称为Forest R-CNN,可以作为一个即插即用模块,应用于大多数目标识别模型,能够识别1000多个类别。在大词汇表数据集LVIS上进行了广泛的实验。与Mask R-CNN基线相比,Forest R-CNN在rare categories和overall categories上分别显著提高了11.5% AP和3.9% AP。此外,我们在LVIS数据集上获得了最先进的结果。
主要框架及实验结果
声明:文章来自于网络,仅用于学习分享,版权归原作者所有,侵权请联系删除。