FCN: 卷积和转置卷积等

各种卷积的动态图

FCN: 卷积和转置卷积等

这里y是下一层(i,j)处的值,k是kernel size, s是stride,f泛指卷积层,池化层和**函数。这些操作都具有局部性,限定在x的delta邻域中。

FCN: 卷积和转置卷积等

这里是说两个这样的操作可以进行复合,复合后的“等效”kernel size和stride在右下角。
FCN: 卷积和转置卷积等

如上图,若第一层的k=3,第二层的k=1,则等效k=3;若第一层的k=3,第二层的k=2,则等效k=4。

相关基础知识:
卷积层feature map大小
FCN: 卷积和转置卷积等

If you stack two 3x3 CONV layers on top of each other then you can convince yourself that the neurons on the 2nd layer are a function of a 5x5 patch of the input (we would say that the effective receptive field of these neurons is 5x5). If we use dilated convolutions then this effective receptive field would grow much quicker. cs231n

Transposed convolution arithmetic
所谓的转置是针对将卷积层表达为矩阵运行得到的,在反向传播中转置矩阵使得后面低维度的Loss变为高维度。见下图
FCN: 卷积和转置卷积等

FCN paper中将不同的池化层进行了融合:
FCN: 卷积和转置卷积等

获得了提升:
FCN: 卷积和转置卷积等

反卷积和上池化,直接引用【总结】图像语义分割之FCN和CRF

FCN: 卷积和转置卷积等

最后,一个图像分割的专栏:https://zhuanlan.zhihu.com/semantic-segmentation