如今落地的CV业务所用方法不一。但其中有两种算法简单高效,较为常用:
算法 | 优点 | 缺点 | 改进方案 |
---|---|---|---|
RetinaNet | 很简单、精度较高、速度快 | fp较多 | 增加后处理 |
FPN + Faster R-CNN | 较简单、精度很高、fp少 | 速度有待提高 | 简化basemodel |
甚至连无人驾驶这种对实时性要求极高的应用场景,也多采用FPN+Faster R-CNN作为其基本算法。
还有的会用 Light-head R-CNN、Deformable R-FCN 等。
其他算法,诸如YOLO系、SSD等等,都因为检测精度太差,而空有那么高的速度,采用较少。 SNIP一类的,普通显卡甚至都带不起来,更别提落地了。
在ResNet (2015.12) 出来之前,basemodel经历了从AlexNet一家独大,到VGG和GoogleNet平分天下的时期。
ResNet出来后,由于其简单和强大,成为了basemodel的绝对标杆。
如今从业者一般遵循以下流程:
Basemodel部分,一般直接导入现成训练好的。之后在自己的数据集上fine-tune整个网络。
市面上的涨点方法汗牛充栋,主要有Large/small kernel(大/小卷积核)、Loss function(目标函数)、Stronger basemodel(更强的basemodel)、Scale handling(尺度设计)、RoIAlign(对齐RoIPooling)、Deformable convolution(形变卷积)、Atrous convolution(空洞卷积)、Cascade(级联)、OHEM(在线困难样本挖掘)、BN(规范化)、Regulation(正则化)、Large mini-batch、Emsemble learning(集成学习)、Multi-scale training and testing等等。
But,绝大部分trick,都不如根据test情况,针对性地 加数据 来得实在。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有