YOLOv7原作者出手,YOLOv9的性能依旧时一枝独秀:
YOLOv9的整体架构图如下(根据YOLOv9.yaml绘制):
PGI主要包括三个组成部分,即:
从图中可以看出,PGI推理过程仅使用主分支,因此不需要任何额外的推理成本。
YOLOv9提出了新网络架构——GELAN。GELAN通过结合两种神经网络架构,即结合用梯度路径规划(CSPNet)和(ELAN)设计了一种广义的高效层聚合网络(GELAN);GELAN综合考虑了轻量级、推理速度和准确度。
GELAN整体架构如上图所示。YOLOv9将ELAN的能力进行了泛化,原始ELAN仅使用卷积层的堆叠,而GELAN可以使用任何计算块作为基础Module。
通过上图代码可以看到,样本匹配依旧使用的是TaskAlign样本匹配。和YOLOv8、YOLOE、YOLOv6等算法保持一致;
分类损失:BCE Loss 回归损失:DFL Loss + CIoU Loss
可以看出,YOLOv9的性能最为优秀,应该会成为2D检测的新宠。
[1].YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information [2].https://github.com/WongKinYiu/yolov9