MobileNets论文解析

论文全称:

MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

下载地址:

 https://arxiv.org/pdf/1704.04861.pdf

论文核心思想:

本文对我们常见的卷积操作进行了改进,使得计算量得到了降低。

 

常规卷积:

常规卷积操作的示意图:

MobileNets论文解析

论文提出的深度可分离卷积(Depthwise separable convolutions)

由两部分组成:

第1部分:在深度上进行卷积(Depthwise convolution),即:在每一个通道的二维矩阵上进行卷积。

在这个部分中的卷积核是2维的,即卷积核的深度为1,输入图片的深度是多少,卷积核就有多少个。

depthwise convolution 示意图:

MobileNets论文解析

第2部分:在点上进行卷积(Pointwise convolution ),即:在二维矩阵每一个点上对所有的通道进行卷积。

在这个部分中的卷积核虽然是3维,但是宽和高均为1,输入图片的面积(宽*高的值)是多少,就有多少个卷积核。

pointwise convolution 示意图:

MobileNets论文解析

最后,用一张图来描述完整的深度可分离卷积:

MobileNets论文解析

至于论文中关于计算量的推导计算,这里就不作赘述了。

如有问题,欢迎交流。

文中图片来自网络:

https://eli.thegreenplace.net/2018/depthwise-separable-convolutions-for-machine-learning/

侵删。