「Deep Learning」语义图像分割模型：DeepLab系统及其发展

Sina Weibo：小锋子Shawn

Tencent E-mail：[email protected]
http://blog.csdn.net/dgyuanshaofeng/article/details/79324057

一、分割性能(PASCAL VOC Challenge Performance)

1、DeepLabv1，71.6% IOU accuracy，论文，2014年12月。

2、DeepLabv1+EdgeNet+DT，76.3% ，论文，2015年11月。

3、DeepLabv2，79.7，论文，2016年6月。

4、DeepLabv3，85.7%，论文，2017年6月。

5、DeepLabv3+，89.0%，论文，2018年2月。

作者(Liang-Chieh Chen)的其他工作可在这里查阅，包括DeepLab系列和MobileNetV2。

二、模型分析

5、DeepLabv3+

要件：

1)、空间金字塔池化模块SPP(由何恺明等人提出)，可编码多尺度上下文信息。

2)、编码-解码结构ED(U-Net、SegNet、FCN、DeconvNet等)，通过解码阶段逐渐恢复空间大小，可捕捉更为锐利的物体边界。

3）、DeepLabv3

大致内容：

DeepLabv3+，结合了1)和2)，在DeepLab3基础上，引入解码模块decoder优化物体边界；探究了Xception模型；将逐层分离卷积DSC应用于Atrous空间金字塔池化(ASPP)和解码模块decoder。

具体内容：

DeepLabv3作为编码模块，见图1。

「Deep Learning」语义图像分割模型：DeepLab系统及其发展

图1

解码模块deconder，见图1。

级联操作之后有两块卷积/深度特征，粉色块来自进行空间卷积操作时的各个底层特征再各自跟一个点卷积(用于减少通道)，绿色块来自高层特征再跟一个双线性4倍上采样，特征级联后继续进行一系列3x3卷积和最好的双线性4倍上采样。

Xception模型的改进

DSC如何应用于ASPP和Encoder-Decoder