深度网络推理加速（Learning both Weights and Connections for Efficient Neural Networks）

摘要

针对卷积神经网络的结构在训练之前就已经被固定下来，因而训练过程无法优化网络结构，本文提出了一种三步法在保留网络能力的前提下进行剪枝。首先，让网络在训练中学习到哪些连接是重要的；其次，对不重要的连接进行剪枝；最后，在剪枝后的网路欧上进行微调。用该方法对ImageNet数据的AlexNet和VGG-16网络进行优化，分别将模型减小了十倍左右，而没有损失精度。

下图是在45nm工艺的CMOS芯片上基本的代数运算和内存操作的功耗，大的网络模型无法加载到片上存储中会导致需要大量的DRAM存储访问，其功耗比一次片上代数运算要高好几个数量级！

深度网络推理加速（Learning both Weights and Connections for Efficient Neural Networks）

摘要

相关推荐