针对CNN的一种新的数据增强方式:RICAP

本文针对日本神户大学发表在ACML2018的一篇论文《RICAP: Random Image Cropping and Patching Data Augmentation for Deep CNNs》进行解读。
针对CNN的一种新的数据增强方式:RICAP

Motivations

CNN在不同领域都取得了令人振奋的成绩,主要原因在于CNN中的大量参数能够拟合各种各样的数据分布。然而过多的参数,相比较而言较小的数据会导致一定程度的过拟合现象。数据增强作为一种增加数据集样本的策略,能够有效的缓解过拟合的问题。
主要的数据增强包含flipping,resizing等,最近来自厦大的钟准博士提出的random erasing,来自埃克塞特大学的研究人员提出的cutout以及MIT&FAIR提出的mixup都被证明非常有效。本文受到启发,提出一种新的策略——random image cropping and patching(PACIP)

Methods

针对CNN的一种新的数据增强方式:RICAP
上图是一个非常简易的解释图标,即在四张图中裁剪一部分,将这些部分重新组合成新的图片。以下解释具体实现方法。
针对CNN的一种新的数据增强方式:RICAP
假设已知w和h(左上角图片的宽和高),对于每一个组成图片的小图片,根据与w和h的关系,能够计算出每一个小图片的宽度以及高度。在裁剪小图片的过程中,为了随机选择一个小区域,裁剪区域左上角的坐标满足
针对CNN的一种新的数据增强方式:RICAP
,其中K属于{1,2,3,4}。
在训练过程中,由于需要给图像指定标签,label值表示为:
针对CNN的一种新的数据增强方式:RICAP
即表示按照子图片占原图像面积的比例给原图像权重赋值。
由于w和h也是满足一定的分布规则,分为三种情况:
针对CNN的一种新的数据增强方式:RICAP
对于anywhere:
满足:
针对CNN的一种新的数据增强方式:RICAP
对于center:
满足:
针对CNN的一种新的数据增强方式:RICAP
当t等于0,退化到anywhere情况。
对于corner:
针对CNN的一种新的数据增强方式:RICAP
Results

采用WideResNet架构的Test Error Rates:
针对CNN的一种新的数据增强方式:RICAP
采用WideResNet-50-2-bottleneck架构的Test Error Rates:
针对CNN的一种新的数据增强方式:RICAP
可以发现该方法无论是和cutout还是mixup相比,都有一定的竞争力。
针对CNN的一种新的数据增强方式:RICAP