MobileNets论文解析
论文全称:
MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
下载地址:
https://arxiv.org/pdf/1704.04861.pdf
论文核心思想:
本文对我们常见的卷积操作进行了改进,使得计算量得到了降低。
常规卷积:
常规卷积操作的示意图:
论文提出的深度可分离卷积(Depthwise separable convolutions)
由两部分组成:
第1部分:在深度上进行卷积(Depthwise convolution),即:在每一个通道的二维矩阵上进行卷积。
在这个部分中的卷积核是2维的,即卷积核的深度为1,输入图片的深度是多少,卷积核就有多少个。
depthwise convolution 示意图:
第2部分:在点上进行卷积(Pointwise convolution ),即:在二维矩阵每一个点上对所有的通道进行卷积。
在这个部分中的卷积核虽然是3维,但是宽和高均为1,输入图片的面积(宽*高的值)是多少,就有多少个卷积核。
pointwise convolution 示意图:
最后,用一张图来描述完整的深度可分离卷积:
至于论文中关于计算量的推导计算,这里就不作赘述了。
如有问题,欢迎交流。
文中图片来自网络:
https://eli.thegreenplace.net/2018/depthwise-separable-convolutions-for-machine-learning/
侵删。