针对CNN的一种新的数据增强方式：RICAP

本文针对日本神户大学发表在ACML2018的一篇论文《RICAP: Random Image Cropping and Patching Data Augmentation for Deep CNNs》进行解读。
针对CNN的一种新的数据增强方式：RICAP

Motivations

CNN在不同领域都取得了令人振奋的成绩，主要原因在于CNN中的大量参数能够拟合各种各样的数据分布。然而过多的参数，相比较而言较小的数据会导致一定程度的过拟合现象。数据增强作为一种增加数据集样本的策略，能够有效的缓解过拟合的问题。
主要的数据增强包含flipping，resizing等，最近来自厦大的钟准博士提出的random erasing，来自埃克塞特大学的研究人员提出的cutout以及MIT&FAIR提出的mixup都被证明非常有效。本文受到启发，提出一种新的策略——random image cropping and patching(PACIP)

Methods

针对CNN的一种新的数据增强方式：RICAP
上图是一个非常简易的解释图标，即在四张图中裁剪一部分，将这些部分重新组合成新的图片。以下解释具体实现方法。

假设已知w和h（左上角图片的宽和高），对于每一个组成图片的小图片，根据与w和h的关系，能够计算出每一个小图片的宽度以及高度。在裁剪小图片的过程中，为了随机选择一个小区域，裁剪区域左上角的坐标满足
针对CNN的一种新的数据增强方式：RICAP
，其中K属于{1，2，3，4}。
在训练过程中，由于需要给图像指定标签，label值表示为：

即表示按照子图片占原图像面积的比例给原图像权重赋值。
由于w和h也是满足一定的分布规则，分为三种情况：
针对CNN的一种新的数据增强方式：RICAP
对于anywhere：
满足：

对于center：
满足：

当t等于0，退化到anywhere情况。
对于corner：

Results

采用WideResNet架构的Test Error Rates：
针对CNN的一种新的数据增强方式：RICAP
采用WideResNet-50-2-bottleneck架构的Test Error Rates：

可以发现该方法无论是和cutout还是mixup相比，都有一定的竞争力。

针对CNN的一种新的数据增强方式：RICAP

Motivations

Methods

相关推荐