微信公众号:OpenCV学堂 关注获取更多计算机视觉与深度学习知识
概述
2023年底出现了一篇论文介绍了一种新的卷积网络结构AKConv,它是可变形卷积网络结构的基础更进一步,实现了一种更加随机的卷积结构与参数选择的卷积神经网络结构,效果比DCN更加厉害,但是随着卷积窗口的增大,参数量却比DCN要少很多,图示如下:
生成AKConv
正常的卷积神经网络结构中,卷积操作都是网格化采样操作,网格内的全部参数都是参与运算过程。而 AKConv为了得到形状不规则的卷积核,因此,首先假设生成卷积核 Pn 的初始采样坐标,然后为再采样点创建不规则网格。最后,我们将它们拼接起来,生成整体采样网格。作者论文给出的伪代码如下
生成算法生成任意卷积核大小的初始采样坐标,它提供不规则卷积核大小的初始采样形状,图示如下
AKConv的扩展结构
实验对比
修改YOLOv5的Conv层替换为AKConv以后,对比实验如下:
作者还给出了改进版本的YOLOv5、YOLOv7、YOLOv8的模型结构与AKConv卷积结构的实现代码,点击这里可以查看到:
https://github.com/CV-ZhangXin/AKConv
不知道怎么修改YOLOv5与YOLOv8模型结构,现在学习还来得及,扫码查看YOLOv8全家桶课程,一键获取YOLOv8源码修改与模型修改能力,从此解锁涨点技能。