摘要
在分析现有IoU-based BBR的基础上,提出区分不同的回归样本并使用不同尺度的辅助边界框来计算损失,以有效加速边界框回归过程。对于高IoU样本,使用较小的辅助边界框计算损失可以加速收敛,而较大的辅助边界框则适合低IoU样本,作者将其命名为Inner-IoU。Inner-IoU通过使用一个可调整的缩放因子比率来控制计算损失的辅助边界框的尺度大小,以适应不同的数据集和检测器。将Inner-IoU集成到现有的基于IoU的损失函数中进行模拟和对比实验,结果表明该方法在检测性能方面有了进一步的提升,验证了Inner-IoU损失的有效性和泛化能力。
本文使用Inner-IoU+clou改进YoloV8,在我自己的数据及实现了轻微的涨点,这也是符合预期的!这种改进涨点有限,而且要反复调整因子的比率才行!
完整链接:
https://blog.csdn.net/m0_47867638/article/details/134473729?spm=1001.2014.3001.5501
YOLOv8l summary (fused): 268 layers, 43631280 parameters, 0 gradients, 165.0 GFLOPs
Class Images Instances Box(P R mAP50 mAP50-95): 100%|██████████| 29/29 [
all 230 1412 0.922 0.957 0.986 0.737
c17 230 131 0.973 0.992 0.995 0.825
c5 230 68 0.945 1 0.995 0.836
helicopter 230 43 0.96 0.907 0.951 0.607
c130 230 85 0.984 1 0.995 0.655
f16 230 57 0.955 0.965 0.985 0.669
b2 230 2 0.704 1 0.995 0.722
other 230 86 0.903 0.942 0.963 0.534
b52 230 70 0.96 0.971 0.978 0.831
kc10 230 62 0.999 0.984 0.99 0.847
command 230 40 0.97 1 0.995 0.811
f15 230 123 0.891 1 0.992 0.701
kc135 230 91 0.971 0.989 0.986 0.712
a10 230 27 1 0.555 0.899 0.456
b1 230 20 0.972 1 0.995 0.793
aew 230 25 0.945 1 0.99 0.784
f22 230 17 0.913 1 0.995 0.725
p3 230 105 0.99 1 0.995 0.801
p8 230 1 0.637 1 0.995 0.597
f35 230 32 0.939 0.938 0.978 0.574
f18 230 125 0.985 0.992 0.987 0.817
v22 230 41 0.983 1 0.995 0.69
su-27 230 31 0.925 1 0.995 0.859
il-38 230 27 0.972 1 0.995 0.811
tu-134 230 1 0.663 1 0.995 0.895
su-33 230 2 1 0.611 0.995 0.796
an-70 230 2 0.766 1 0.995 0.73
tu-22 230 98 0.984 1 0.995 0.831
Speed: 0.2ms preprocess, 3.8ms inference, 0.0ms loss, 0.8ms postprocess per image
Class Images Instances Box(P R mAP50 mAP50-95): 100%|██████████| 15/15 [00:03<00:00, 4.79it/s]
all 230 1412 0.959 0.954 0.988 0.741
c17 230 131 0.994 0.992 0.995 0.825
c5 230 68 0.951 1 0.993 0.846
helicopter 230 43 0.95 0.977 0.975 0.596
c130 230 85 0.97 0.976 0.992 0.657
f16 230 57 0.924 0.947 0.977 0.68
b2 230 2 0.883 1 0.995 0.623
other 230 86 0.976 0.943 0.984 0.554
b52 230 70 0.981 0.971 0.985 0.836
kc10 230 62 0.996 0.984 0.989 0.85
command 230 40 0.992 1 0.995 0.835
f15 230 123 0.976 0.974 0.993 0.697
kc135 230 91 0.989 0.989 0.991 0.699
a10 230 27 1 0.562 0.887 0.422
b1 230 20 1 0.981 0.995 0.759
aew 230 25 0.95 1 0.995 0.777
f22 230 17 0.889 1 0.989 0.735
p3 230 105 1 0.976 0.995 0.797
p8 230 1 0.824 1 0.995 0.697
f35 230 32 1 0.903 0.99 0.582
f18 230 125 0.984 0.99 0.992 0.825
v22 230 41 0.992 1 0.995 0.727
su-27 230 31 0.983 1 0.995 0.886
il-38 230 27 0.988 1 0.995 0.847
tu-134 230 1 0.825 1 0.995 0.895
su-33 230 2 1 0.586 0.995 0.796
an-70 230 2 0.878 1 0.995 0.728
tu-22 230 98 0.997 1 0.995 0.836
Speed: 0.2ms preprocess, 9.4ms inference, 0.0ms loss, 0.6ms postprocess per image
提升不多,不过在小目标的情况应该好一点,因为,小目标的识别框都是偏大一些,加入inner_iou或许会改善!