语义分割--LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation

LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation

Torch7 code: https://github.com/e-lab/LinkNet

本文主要侧重语义分割的速度问题，算法思路类似 U-Net，引入了 residual blocks

LinkNet Architecture
语义分割--LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation
conv means convolution 和 full-conv means full convolution
/2 denotes downsampling by a factor of 2 which is achieved by performing strided convolution 降采样2倍
∗2 means upsampling by a factor of 2 上采样2倍

输入图像首先使用一个 7*7的卷积核卷积，再用一个步长为2的 3*3 spatial max-pooling

encoder-block 如下：
语义分割--LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation

decoder-block 如下：
语义分割--LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation

各个模块特征图数量：
语义分割--LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation

首先来看看速度如何：
语义分割--LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation
模型大小和运算量：

再来看看性能
语义分割--LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation

语义分割--LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation

语义分割--LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation

相关推荐