[「Pascal算法摆渡人」]「公众号」、「知乎」、「小红书」等感谢关注。Hi,大家好!我是Pascal_M。
我们一起读起来!!!了解过往「历史文献」的方法和不足之处,追寻「最前沿」的文献和技术。
「标题」:Improved Regularization of Convolutional Neural Networks with Cutout
「时间」:2017
「引用次数」:1862(截止目前)
1 遇到问题
文章除了解决遮挡问题外,还有从dropout上得到启发。众所周知,Dropout随机隐藏一些神经元,最后的网络模型相当于多个模型的集成。类似于dropout的思路,这篇文章将drop用在了输入图片上,并且drop掉连续的区域——即矩形区域。
问题来了,是如何实现Cutout方法?
我们知道数据扩充正则化,防止CNN过拟合。
2 前期提要
1)数据增强
之前常见的策略有:
平移(Translation)、旋转(Rotation)、翻转(Fliplr)、放缩(zoom)、错切(shear)、裁剪(crop)、亮度、对比度增强、锐化(Sharpen)和添加噪声。
2)Mixup方法
mixup的基本思想是将数据混合构建虚拟样本,如下图有两个数据点A、B,其中A是class 0,而B是class 1,Label对应就是一个one hot向量。mixup就是通过混合AB来构建虚拟数据点,同时标签也进行混合得到概率分布,这样就得到了新的样本。
回顾一下:Mixup方法
[CV - Image Classification-2017]图像分类之数据增强Mixup方法 - 超越经验风险最小化
3 解决方案
1)Cutout方法
Cutcout方法很就是在训练的时候,在随机位置应用一个方形矩阵。如下图:
2)代码部分
4 实验结论
1)图像分类数据集-CIFAR10、CIFAR100、SHVN
备注:SVHN是一个真实世界的街道门牌号数字识别数据集。
2)STL-10
3) Cutout对激活的影响分析
5 Pascal曰
1)Cutout方法:随机的将样本中的部分区域cut掉,并且填充0像素值,分类的结果不变。
2)还是要明白数据增强的目的是防止CNN网络过拟合。
3)未来,还有什么样的数据增强策略呢?
针对人群:
不知道如何「入门算法 「,对于」初学者」这里有完整的学习路径图(历史中「经典」模型文献和论文复现),完成后将成为合格「初级算法工程师」。
不知道「行业解决方案」,对于「算法工程师」这里有具体的行业中落地方案和呈现出商业价值,阅读后提供新的解决方法想法和成为「算法专家」。
蓦然回首,自己从算法(数学)专业学习以及工作已十年有余。
同时希望大家成为算法经历者、分享者和创造者。
入群
领取专属 10元无门槛券
私享最新 技术干货