1 AlexNet(2012,ImageNet冠军， CNN用于图像分类的开山之作）

结构：5 卷积层+3个全连接层（卷积核size:11,5,3）

【经典神经网络】-AlexNet/VGG/GoogLeNet/ResNet

特点：

ReLU **函数 （避免了sigmoid的梯度消失-反向传播的时候会连乘sigmoid的导数，初始值很大的话导数接近于0，导致前层网络梯度越来越小；计算量减小，加快了训练速度）

LRN（Local Response Normalization）: 利用前后几层对当前层的输出做平滑处理（抑制机制，避免ReLU响应结果非常大，做归一化处理，增加泛化能力）

fc层加入Dropout ：每次参数更新时，以一定的比例使一些神经元不参与前后向传播（相当于模型组合，减小过拟合）

Data Augmentation 数据扩充（随机裁剪，水平翻转），减小过拟合

重叠池化（减小过拟合）

多GPU训练

2 VGG（2014， ImageNet 亚军）

证明了增加网络深度一定程度上会影响最终性能

多个版本VGG 11/13/16/19（VGG16:13卷积层+3 fc）

【经典神经网络】-AlexNet/VGG/GoogLeNet/ResNet

特点：

用连续的 3 x 3 卷积核替代了Alexnet中较大的卷积核（保证相同的感受野下，减少了参数；引入更多的非线性层增加了网络的深度）

最大池化层2x2，卷积层3x3，结构简单

VGG参数较多，内存占用较大（140M），训练时间长

3 GoogLeNet（2014，ImageNet冠军）

22层（参数量少：500万，AlexNet 是其12倍，VGG是其3倍）

【经典神经网络】-AlexNet/VGG/GoogLeNet/ResNet

特点：

Inception v1结构，多个卷积堆叠在一起，最后将通道相加（完成了稀疏矩阵的聚合；增加网络的宽度；增加网络对图像尺寸的适应性）

提出1 x1 卷积（降维，减少参数量：5x5前接1x1，参数量减少约四倍；不改变feature map的条件下增加非线性-网络深度；融合不同通道的信息）

引入辅助分类器，在中间层加入softmax做分类，以一定的权重加入到最终的分类结果中，相当于模型融合

Incelption v2：减小参数量，增加深度，将5x5替换为3x3；将池化和卷积并行操作，再合并（先池化容易丢失信息，先卷积计算量太大）

Inceptino v3：又将 n x n 替换为 1x n 接 n x1（中等特征图上效果好12-20）

Inceptino v4：利用Resnet思想引用残差改进v3