前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >RT-DETR算法优化改进:Backbone改进 | HGBlock完美结合PPHGNetV2 RepConv

RT-DETR算法优化改进:Backbone改进 | HGBlock完美结合PPHGNetV2 RepConv

原创
作者头像
AI小怪兽
发布于 2023-11-14 02:40:28
发布于 2023-11-14 02:40:28
2.3K00
代码可运行
举报
文章被收录于专栏:YOLO大作战YOLO大作战
运行总次数:0
代码可运行

本文独家改进: PPHGNetV2助力RT-DETRHGBlock与PPHGNetV2 RepConv完美结合

推荐指数:五星

HGBlock_PPHGNetV2 | 亲测在多个数据集能够实现涨点

1.RT-DETR介绍

论文: https://arxiv.org/pdf/2304.08069.pdf

RT-DETR (Real-Time DEtection TRansformer) ,一种基于 DETR 架构的实时端到端检测器,其在速度和精度上取得了 SOTA 性能

为什么会出现:

YOLO 检测器有个较大的待改进点是需要 NMS 后处理,其通常难以优化且不够鲁棒,因此检测器的速度存在延迟。为避免该问题,我们将目光移向了不需要 NMS 后处理的 DETR,一种基于 Transformer 的端到端目标检测器。然而,相比于 YOLO 系列检测器,DETR 系列检测器的速度要慢的多,这使得"无需 NMS "并未在速度上体现出优势。上述问题促使我们针对实时的端到端检测器进行探索,旨在基于 DETR 的优秀架构设计一个全新的实时检测器,从根源上解决 NMS 对实时检测器带来的速度延迟问题。

RT-DETR是第一个实时端到端目标检测器。具体而言,我们设计了一个高效的混合编码器,通过解耦尺度内交互和跨尺度融合来高效处理多尺度特征,并提出了IoU感知的查询选择机制,以优化解码器查询的初始化。此外,RT-DETR支持通过使用不同的解码器层来灵活调整推理速度,而不需要重新训练,这有助于实时目标检测器的实际应用。RT-DETR-L在COCO val2017上实现了53.0%的AP,在T4 GPU上实现了114FPS,RT-DETR-X实现了54.8%的AP和74FPS,在速度和精度方面都优于相同规模的所有YOLO检测器。RT-DETR-R50实现了53.1%的AP和108FPS,RT-DETR-R101实现了54.3%的AP和74FPS,在精度上超过了全部使用相同骨干网络的DETR检测器。

RT-DETR作者团队认为只需将Encoder作用在S5 特征上,既可以大幅度地减小计算量、提高计算速度,又不会损伤到模型的性能。为了验证这一点,作者团队设计了若干对照组,如下图所示。

实验结果:

DETR类在COCO上常用的尺度都是800x1333,以往都是以Res50 backbone刷上45 mAP甚至50 mAP为目标,而RT-DETR在采用了YOLO风格的640x640尺度情况下,也不需要熬时长训几百个epoch 就能轻松突破50mAP,精度也远高于所有DETR类模型。

1.1 PPHGNetV2 RepConv介绍

源码:https://github.com/PaddlePaddle/PaddleDetection/blob/develop/ppdet/modeling/backbones/hgnet_v2.py

2.HGBlock_PPHGNetV2引入到RT-DETR

2.1新建ultralytics/nn/backbone/PaddleBackbone.py

​核心代码:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
class Blocks(nn.Module):
    def __init__(self, ch_in, ch_out, block, count, stage_num, act='relu', variant='d'):
        super().__init__()

        self.blocks = nn.ModuleList()
        for i in range(count):
            self.blocks.append(
                block(
                    ch_in, 
                    ch_out,
                    stride=2 if i == 0 and stage_num != 2 else 1, 
                    shortcut=False if i == 0 else True,
                    variant=variant,
                    act=act)
            )
            if i == 0:
                ch_in = ch_out * block.expansion

    def forward(self, x):
        out = x
        for block in self.blocks:
            out = block(out)
        return out

详见:

https://blog.csdn.net/m0_63774211/article/details/134375155

我正在参与2023腾讯技术创作特训营第三期有奖征文,组队打卡瓜分大奖!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
RT-DETR优化改进:轻量级Backbone改进 | 支持Paddle轻量级 rtdetr-r18、rtdetr-r34、rtdetr-r50、rtdet
本文独家改进: 支持百度飞浆resnet各个版本, rtdetr-r18、rtdetr-r34、rtdetr-r50、rtdetr-r101等
AI小怪兽
2023/11/17
5.2K0
RT-DETR手把手教程,注意力机制如何添加在网络的不同位置进行创新优化
本文独家改进:本文首先复现了将EMA引入到RT-DETR中,并跟不同模块进行结合创新;1)Rep C3结合;2)直接作为注意力机制放在网络不同位置;3)高效和HGBlock结合;
AI小怪兽
2023/11/22
1.5K0
YOLOv8太卷啦 | YOLOv8官方仓库正式支持RT-DETR训练、测试以及推理
百度RT-DETR概述。RT-DETR模型架构图显示骨干{S3、S4、S5}的最后三个阶段作为编码器的输入。高效的混合编码器通过尺度内特征交互(AIFI)和跨尺度特征融合模块(CCFM)将多尺度特征转换为图像特征序列。IoU感知查询选择用于选择固定数量的图像特征以用作解码器的初始对象查询。最后,具有辅助预测头的解码器迭代地优化对象查询,以生成框和置信度分数(源)。
集智书童公众号
2023/09/04
2.8K0
YOLOv8太卷啦 | YOLOv8官方仓库正式支持RT-DETR训练、测试以及推理
RT-DETR全解析:超越 YOLO,实时物体检测更快更精准(附代码)
近年来,物体检测技术在许多领域取得了显著进展,如视频监控、自动驾驶、智能家居等。传统的物体检测模型,如YOLO(You Only Look Once)系列,已经在实时检测任务中得到了广泛应用,但仍然存在一些限制,比如速度与精度的平衡问题。
CoovallyAIHub
2025/01/09
2.7K0
RT-DETR全解析:超越 YOLO,实时物体检测更快更精准(附代码)
YoloV8改进策略:Neck改进|Efficient-RepGFPN,实时目标检测的王者Neck
在实时目标检测领域,Yolo系列模型一直以其高效和准确而著称。近日,我们成功将Efficient-RepGFPN模块引入YoloV8中,实现了显著的涨点效果。这一改进不仅进一步提升了YoloV8的检测精度,还保留了其原有的高效性能,为实时目标检测领域带来了新的突破。
AI浩
2024/10/22
9760
YoloV8改进策略:Neck改进|Efficient-RepGFPN,实时目标检测的王者Neck
RT-DETR优化改进:Backbone改进 | VanillaNet一种新视觉Backbone,极简且强大!华为诺亚2023
本文独家改进: VanillaNet助力RT-DETR ,替换backbone,简到极致、浅到极致!深度为6的网络即可取得76.36%@ImageNet的精度,深度为13的VanillaNet甚至取得了83.1%的惊人性能。
AI小怪兽
2023/11/20
7740
YOLO系列算法全家桶——YOLOv1-YOLOv9详细介绍 !!
YOLO系列的核心思想就是把目标检测转变为一个回归问题,利用整张图片作为网络的输入,通过神经网络,得到边界框的位置及其所属的类别。
JOYCE_Leo16
2024/04/09
30.5K1
YOLO系列算法全家桶——YOLOv1-YOLOv9详细介绍 !!
YOLOv5改进: RT-DETR引入YOLOv5,neck和检测头助力检测
本文独家改进: 1) RT-DETR neck代替YOLOv5 neck部分; 2)引入RTDETRDecoder
AI小怪兽
2023/12/17
1.7K1
RT-DETR改进:新的设计范式Slim Neck助力RT-DETR | Neck改进
本文独家改进: 采用 GSConv 方法的 Slim-Neck 可缓解 DSC 缺陷对模型的负面影响,并充分利用深度可分离卷积 DSC 的优势,引入RT-DETR二次创新;
AI小怪兽
2023/11/20
9380
YOLOv10开源|清华用端到端YOLOv10在速度精度上都生吃YOLOv8和YOLOv9
实时目标检测一直是计算机视觉研究领域的一个重点,旨在在低延迟下准确预测图像中物体的类别和位置。它被广泛应用于各种实际应用中,包括自动驾驶,机器人导航,物体跟踪等。近年来,研究行人一直致力于设计基于CNN的目标检测器以实现实时检测。其中,YOLOs因其性能和效率之间的巧妙平衡而越来越受欢迎。YOLOs的检测流程包括两部分:模型前向过程和NMS后处理。然而,这两者仍存在不足,导致次优的准确度-延迟边界。
集智书童公众号
2024/05/28
3.5K0
YOLOv10开源|清华用端到端YOLOv10在速度精度上都生吃YOLOv8和YOLOv9
YOLOv8改进策略: AIFI (尺度内特征交互)助力YOLO | YOLO终结者?RT-DETR一探究竟
💡💡💡本文全网首发独家改进: AIFI (尺度内特征交互)助力YOLO ,提升尺度内和尺度间特征交互能力,同时降低多个尺度的特征之间进行注意力运算,计算消耗较大等问题
AI小怪兽
2023/11/05
5K0
RT-DETR优化改进:Backbone改进|RIFormer:无需TokenMixer也能达成SOTA性能的极简ViT架构 | CVPR2023
本文独家改进:RIFormer助力RT-DETR ,替换backbone, RIFormer-M36的吞吐量可达1185,同时精度高达82.6%;而PoolFormer-M36的吞吐量为109,精度为82.1%。
AI小怪兽
2023/11/20
1.1K0
YOLOv5-Face | 原理超精细讲解、训练步骤还原、C++边缘部署(就要这么学!!!)
在WiderFace数据集上的实验结果表明,YOLOv5Face在几乎所有的Easy、Medium和Hard子集上都能达到最先进的性能,超过了特定设计的人脸检测器。 Github地址:https://www.github.com/deepcam-cn/yolov5-face
集智书童公众号
2022/04/07
7.2K0
YOLOv5-Face | 原理超精细讲解、训练步骤还原、C++边缘部署(就要这么学!!!)
起飞咯,DEYO | YOLOv8赋能DETR构建检测达成检测新标杆
DETR的训练范式在很大程度上取决于在ImageNet数据集上预训练其骨干。然而,由图像分类任务和一对一匹配策略提供的有限监督信号导致DETR的预训练不充分的颈部。此外,在训练的早期阶段匹配的不稳定性会导致DETR的优化目标不一致。
AIWalker
2024/02/29
1.5K0
起飞咯,DEYO | YOLOv8赋能DETR构建检测达成检测新标杆
实用目标检测器 | 性能超YoloV5,推理耗时不变(附github源码)
在实际应用场景中,有效性与高效性对于目标检测器非常重要。为了满足这两个问题,研究者全面评估了现有的改进的集合,以提高PP-YOLO的性能,同时几乎保持推理时间不变。
3D视觉工坊
2021/05/18
2.4K0
实用目标检测器 | 性能超YoloV5,推理耗时不变(附github源码)
一种基于YOLOv10的遥感小目标车辆检测算法(原创自研)
💡💡💡本文内容:提出了一种基于YOLOv10的遥感小目标车辆检测算法,包括1)SPPF_attention,重新设计加入注意力机制,提升小目标注意;2)SEAM提升小目标遮挡物性能提升;
AI小怪兽
2024/09/10
6240
RT-DETR优化改进: EfficientViT,基于级联分组注意力模块的全新实时网络架构
本文独家改进:EfficientViT助力RT-DETR ,替换backbone,包括多头自注意力(MHSA)导致的大量访存时间,注意力头之间的计算冗余,以及低效的模型参数分配,进而提出了一个高效ViT模型EfficientViT
AI小怪兽
2023/11/20
1K0
渣土车识别监测 渣土车未盖篷布识别抓拍算法
渣土车识别监测 渣土车未盖篷布识别抓拍算法通过yolov7深度学习训练模型框架,渣土车识别监测 渣土车未盖篷布识别抓拍算法在指定区域内实时监测渣土车的进出状况以及对渣土车未盖篷布违规的抓拍和预警。渣土车识别监测 渣土车未盖篷布识别抓拍算法的策略是使用组卷积来扩展计算块的通道和基数。研究者将对计算层的所有计算块应用相同的组参数和通道乘数。然后,每个计算块计算出的特征图会根据设置的组参数 g 被打乱成 g 个组,再将它们连接在一起。此时,渣土车识别监测 渣土车未盖篷布识别抓拍算法每组特征图的通道数将与原始架构中的通道数相同。最后,该方法添加 g 组特征图来执行 merge cardinality。除了保持原有的 ELAN 设计架构,E-ELAN 还可以引导不同组的计算块学习更多样化的特征。
燧机科技
2023/09/24
4770
渣土车识别监测 渣土车未盖篷布识别抓拍算法
YOLO在升级 | PP-YOLO v2开源致敬YOLOV4携带Tricks又准又快地归来(附论文与源码)
为了解决效率和性能这两个问题,本文全面评估了一系列现有改进,以提高PP-YOLO的性能,同时几乎保持推理时间不变。本文将分析一系列改进,并通过增量消融研究从经验上评估它们对最终模型性能的影响。
集智书童公众号
2021/05/28
1.3K0
YOLOv10涨点改进:如何魔改注意力进行二次创新,高效替换PSA | NEU-DET为案列进行展开
💡💡💡本文改进:替换YOLOv10中的PSA进行二次创新,1)EMA替换 PSA中的多头自注意力模块MHSA注意力;2) EMA直接替换 PSA;
AI小怪兽
2024/06/11
1.2K0
推荐阅读
RT-DETR优化改进:轻量级Backbone改进 | 支持Paddle轻量级 rtdetr-r18、rtdetr-r34、rtdetr-r50、rtdet
5.2K0
RT-DETR手把手教程,注意力机制如何添加在网络的不同位置进行创新优化
1.5K0
YOLOv8太卷啦 | YOLOv8官方仓库正式支持RT-DETR训练、测试以及推理
2.8K0
RT-DETR全解析:超越 YOLO,实时物体检测更快更精准(附代码)
2.7K0
YoloV8改进策略:Neck改进|Efficient-RepGFPN,实时目标检测的王者Neck
9760
RT-DETR优化改进:Backbone改进 | VanillaNet一种新视觉Backbone,极简且强大!华为诺亚2023
7740
YOLO系列算法全家桶——YOLOv1-YOLOv9详细介绍 !!
30.5K1
YOLOv5改进: RT-DETR引入YOLOv5,neck和检测头助力检测
1.7K1
RT-DETR改进:新的设计范式Slim Neck助力RT-DETR | Neck改进
9380
YOLOv10开源|清华用端到端YOLOv10在速度精度上都生吃YOLOv8和YOLOv9
3.5K0
YOLOv8改进策略: AIFI (尺度内特征交互)助力YOLO | YOLO终结者?RT-DETR一探究竟
5K0
RT-DETR优化改进:Backbone改进|RIFormer:无需TokenMixer也能达成SOTA性能的极简ViT架构 | CVPR2023
1.1K0
YOLOv5-Face | 原理超精细讲解、训练步骤还原、C++边缘部署(就要这么学!!!)
7.2K0
起飞咯,DEYO | YOLOv8赋能DETR构建检测达成检测新标杆
1.5K0
实用目标检测器 | 性能超YoloV5,推理耗时不变(附github源码)
2.4K0
一种基于YOLOv10的遥感小目标车辆检测算法(原创自研)
6240
RT-DETR优化改进: EfficientViT,基于级联分组注意力模块的全新实时网络架构
1K0
渣土车识别监测 渣土车未盖篷布识别抓拍算法
4770
YOLO在升级 | PP-YOLO v2开源致敬YOLOV4携带Tricks又准又快地归来(附论文与源码)
1.3K0
YOLOv10涨点改进:如何魔改注意力进行二次创新,高效替换PSA | NEU-DET为案列进行展开
1.2K0
相关推荐
RT-DETR优化改进:轻量级Backbone改进 | 支持Paddle轻量级 rtdetr-r18、rtdetr-r34、rtdetr-r50、rtdet
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验