图像分割(1) —— 膨胀卷积的应用


原文链接:MULTI-SCALE CONTEXT AGGREGATION BY DILATED CONVOLUTIONS

提出空洞卷积的背景:

  大部分图像分割的框架都是经历一系列的卷积和下采样的模块之后,再不断与之前卷积结果跨层融合经历一系列卷积和上采样模块的过程,只不过大家融合的方式不尽相同,FCN是逐像素直接相加,U-NET是通道维度拼接,DFAnet是矩阵相乘,但大体框架是一样的,主要还是因为之前的下采样降低了图片的分辨率,而我们只能采用这种方法既能及时补充细节信息又能恢复原始图片分辨率。论文在介绍中,大胆提出这些问题的根源在于池化、下采样层的存在,而他们的存在并不是必要的。

创新点:

 (1)、丢掉池化、下采样模块;
 (2)、构建一种新的卷积网络结构 — 膨胀卷积;
 (3)、提出了一种既可以结合上下文信息,又不降低分辨率的模型。

什么是空洞卷积:

图像分割(1) —— 膨胀卷积的应用
  上图可以看出,卷积核参数量没有发生改变,只是被0填充大小发生变化,随着空洞系数的增大,感受野 ( receptive field ) 也逐渐变大,而他们训练的参数是完全相同的。文章当中给出了上面三种情况感受野的计算公式:
                Fi+1=(2i+21)×(2i+21)F_{i+1}=\left(2^{i+2}-1\right)\times\left(2^{i+2}-1\right)

网络结构:

图像分割(1) —— 膨胀卷积的应用

训练结果:

图像分割(1) —— 膨胀卷积的应用
图像分割(1) —— 膨胀卷积的应用
   扩展卷积在保持参数个数不变的情况下增大了卷积核的感受野,同时它可以保证输出的特征映射(feature map)的大小保持不变。