首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >一周干货回顾&总结(附论文、源码、链接)

一周干货回顾&总结(附论文、源码、链接)

作者头像
计算机视觉研究院
发布2022-01-27 21:03:15
发布2022-01-27 21:03:15
5080
举报

计算机视觉研究院专栏

作者:Edison_G

本周我们“计算机视觉研究院”主要推送了目标检测干货内容,今天给大家总结一下!

优于FCOS:在One-Stage和Anchor-Free目标检测中以最小的成本实现最小的错位(代码待开源)

改进的YOLOv5:AF-FPN替换金字塔模块提升目标检测精度

源代码:https://arxiv.org/pdf/2112.08782.pdf

图像自适应YOLO:恶劣天气下的目标检测

YOLOS:通过目标检测重新思考Transformer(附源代码)

论文地址:https://arxiv.org/pdf/2106.00666.pdf

源代码地址:https://github.com/hustvl/YOLOS

  • YOLOS删除用于图像分类的[CLS]标记,并将一百个随机初始化的检测标记([DET] 标记)附加到输入补丁嵌入序列以进行目标检测。
  • 在训练过程中,YOLOS将ViT中的图像分类损失替换为bipartite matching loss,这里重点介绍YOLOS的设计方法论。

自己觉得挺有意思的目标检测框架,分享给大家(源码论文都有)

首先,查询集图片经过特征提取网络和RPN网络(与Faster/Mask R-CNN中相同)得到感兴趣区域的特征图zi。然后支持集图像和对应的真实标签图经过预测器重建模网络(PRN)得到每个类别对应的类别注意力向量(class-attentive vectors),PRN网络的主体部分与Faster/Mask R-CNN的特征提取网络结构相同且权重共享,得到对应特征图后,通过逐元素Sigmoid函数得到对应的注意力向量vc。最后将RPN网络输出的感兴趣区域特征图zi和PRN网络输出的注意力向量vc通过逐通道相乘的方式进行融合,最后再利用Faster/Mask R-CNN中预测头得到对应个检测图或分割图。

多尺度深度特征(上):多尺度特征学习才是目标检测精髓(干货满满,建议收藏)

多尺度深度特征(下):多尺度特征学习才是目标检测精髓(论文免费下载)

论文地址:回复”MDFN“获取论文

假设:

  • 这些特征图应该能够提供更加精确的细节特征,尤其是对于刚开始的浅层较;
  • 转换特征图的功能应扩展到足够深的层,以便可以将目标的高级抽象语义信息构建到特征图中;
  • 特征图应包含适当的上下文信息,以便可以准确推断出被遮挡的目标,小目标,模糊或重叠的目标并对其进行稳健的定位。

因此,浅层和深层的特征对于目标识别和定位起着必不可少的作用。为了有效地利用检测到的特征信息,应考虑另一约束条件,以防止特征被改变或覆盖。

MDFN通过集成多边界框、多尺度和多层次技术提供多尺度目标检测器。尽管MDFN采用了一个具有相对较小基础网络(VGG-16)的简单框架,但与具有更深或极宽的宏观层次结构的具有更强特征提取能力的那些相比,它获得了更好或具有竞争力的检测结果。所提出的技术在KITTI、PASCAL VOC和COCO数据集上进行了广泛的评估,在KITTI上取得了最佳结果,在PASCAL VOC和COCO上取得了领先的性能。这项研究表明,深层特征提供了突出的语义信息和各种上下文内容,这有助于其在检测小目标或被遮挡目标方面的卓越性能。此外,MDFN 模型计算效率高,在精度和速度之间取得了很好的平衡。

© THE END

转载请联系本公众号获得授权

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-12-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 计算机视觉战队 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档