网络小型化MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

这篇文章的主要贡献在: Depthwise Separable Convolution 来降低计算量。
网络小型化MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

一个标准的卷积层输入输出分别是:
输入特征图F尺寸假定为 F×F× M, 输出特征图 G 尺寸假定为 G×G× N,卷积层可以参数化为 K×K× N× N 卷积核, 其实标准卷积一次性做了两件事:普通的卷积 和 特征数量的变化 。Depthwise separable convolution 主要是将这两件事分开做。分为 depthwise convolutions 和 pointwise convolutions
depthwise convolutions 就是使用 一个 滤波器对每个输入通道进行卷积,特征数量保持不变
Pointwise convolution 就是使用一个 1×1 卷积,将M个输入特征 变为 N个 输出特征

网络小型化MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

其网络主体结构:
网络小型化MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

width multiplier与 resolution multiplier可以帮助我们根据自己的意愿来修改网络,第一个参数来改变网络的宽度,第二个来改变网络的图像分辨率,以减少计算量。