首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

[CV - Image Classification -2017]图像分类之数据增强Cutout方法 -改善的卷积神经网络正则化

[「Pascal算法摆渡人」]「公众号」「知乎」「小红书」等感谢关注。Hi,大家好!我是Pascal_M。

我们一起读起来!!!了解过往「历史文献」的方法和不足之处,追寻「最前沿」的文献和技术。

「标题」:Improved Regularization of Convolutional Neural Networks with Cutout

「时间」:2017

「引用次数」:1862(截止目前)

1 遇到问题

文章除了解决遮挡问题外,还有从dropout上得到启发。众所周知,Dropout随机隐藏一些神经元,最后的网络模型相当于多个模型的集成。类似于dropout的思路,这篇文章将drop用在了输入图片上,并且drop掉连续的区域——即矩形区域。

问题来了,是如何实现Cutout方法?

我们知道数据扩充正则化,防止CNN过拟合。

2 前期提要

1)数据增强

之前常见的策略有:

平移(Translation)、旋转(Rotation)、翻转(Fliplr)、放缩(zoom)、错切(shear)、裁剪(crop)、亮度、对比度增强、锐化(Sharpen)和添加噪声。

2)Mixup方法

mixup的基本思想是将数据混合构建虚拟样本,如下图有两个数据点A、B,其中A是class 0,而B是class 1,Label对应就是一个one hot向量。mixup就是通过混合AB来构建虚拟数据点,同时标签也进行混合得到概率分布,这样就得到了新的样本。

回顾一下:Mixup方法

[CV - Image Classification-2017]图像分类之数据增强Mixup方法 - 超越经验风险最小化

3 解决方案

1)Cutout方法

Cutcout方法很就是在训练的时候,在随机位置应用一个方形矩阵。如下图:

2)代码部分

4 实验结论

1)图像分类数据集-CIFAR10、CIFAR100、SHVN

备注:SVHN是一个真实世界的街道门牌号数字识别数据集。

2)STL-10

3) Cutout对激活的影响分析

5 Pascal曰

1)Cutout方法:随机的将样本中的部分区域cut掉,并且填充0像素值,分类的结果不变。

2)还是要明白数据增强的目的是防止CNN网络过拟合。

3)未来,还有什么样的数据增强策略呢?

针对人群:

不知道如何「入门算法 「,对于」初学者」这里有完整的学习路径图(历史中「经典」模型文献和论文复现),完成后将成为合格「初级算法工程师」

不知道「行业解决方案」,对于「算法工程师」这里有具体的行业中落地方案和呈现出商业价值,阅读后提供新的解决方法想法和成为「算法专家」

蓦然回首,自己从算法(数学)专业学习以及工作已十年有余。

同时希望大家成为算法经历者、分享者和创造者。

入群

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OC7Z1JZSBesiehZUSSYCQnOA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券