MobileNet_v1:Efficient Convolutional Neural Networks for Mobile Vision Applications (论文笔记)

title:

MobileNets:Efficient Convolutional Neural Networks for Mobile Vision Applications

institution: Google

write date: 2019-10-23 18:52

作者给出了移动端和嵌入式视觉应用的MobileNets模型。MobileNets基于流线型结构设计,使用深度可分离卷积(depthwise separable convolutions)来构建轻量级深度神经网络。作者引入了两个简单的全局超参数,在速度(latency)和精确度进行折中。这些超参数允许模型构建者根据问题的限制为其应用选择正确大小的模型。除此之外,作者在资源和准确度权衡的广泛实验,结果表明MobileNets在ImageNet分类问题上与其他流行的模型上有极强的性能。然后作者在广泛的应用场景上演示了MobileNets高效性,包括物体识别、细粒度分类、目标检测、人脸属性和大规模的地理定位。

MobileNet_v1:Efficient Convolutional Neural Networks for Mobile Vision Applications (论文笔记)

本文主要贡献:深度可分离的过滤器(depthwise separable filters)

MobileNet模型基于深度可分离卷积建立,这是一种分解卷积的形式,把标准卷积分解成了一种深度卷积(depthwise convolution)和一个1*1的卷积,1*1卷积又称为逐点卷积(pointwise convolution)。对于MobileNets而言,深度卷积在每个通道(channel)上应用一个卷积核。逐点卷积接着应用1*1卷积把输出和深度卷积结合起来。标准卷积在一个步骤把卷积核和输入结合为新的输出。深度可分离卷积将其分为两层,一层用于滤波(filtering),一层用于结合。这个分解过程极大地减少了计算量。和模型的大小。MobileNet_v1:Efficient Convolutional Neural Networks for Mobile Vision Applications (论文笔记)

和普通卷积层的对比:

MobileNet_v1:Efficient Convolutional Neural Networks for Mobile Vision Applications (论文笔记)

**Architecture

MobileNet_v1:Efficient Convolutional Neural Networks for Mobile Vision Applications (论文笔记)

#@两个超参数:MobileNet_v1:Efficient Convolutional Neural Networks for Mobile Vision Applications (论文笔记)

MobileNet_v1:Efficient Convolutional Neural Networks for Mobile Vision Applications (论文笔记):width multiplier(控制网络宽度,记输入输出通道数)

MobileNet_v1:Efficient Convolutional Neural Networks for Mobile Vision Applications (论文笔记):resolution multiplier(控制分辨率大小)

MobileNet_v1:Efficient Convolutional Neural Networks for Mobile Vision Applications (论文笔记)