VGG16理解

网络上能找到很多VGG的六种网络结构图,这六种结构分为A,A-LRN,B,C,D,E六种,D,E两种结构是常用的,这里使用了Rogn的图:
VGG16理解
Rogn用绿色的部分指明了VGG16采用的结构,从这张图能看到,D中有5个卷积块,总共13层卷积层,最后接了3层全连接层,通过下图可以直观看到VGG16的网络结构:
VGG16理解在上图中,红色为最大池化层,黑色为卷积层+ReLU层,蓝色为全连接层和ReLU层,棕色为softmax层,根据类别得分,对图片进行分类。
刚才提到,有5个卷积块,可以看到,每一个卷积块后都接着一个最大池化层,最大池化层的作用是缩小图片的尺寸。

  1. 输入的图像是224 * 224 * 3,即通道数为3
  2. block1:输入图像后,接上2个卷积层,每个卷积层64个卷积核,通道数为64
  3. 最大池化层:将特征图尺寸缩小到112,通道数翻一倍,变为128
  4. block2:包含2个卷积层,每个卷积层128个卷积核,128个通道
  5. block3:包含3个卷积层,每个卷积层256个卷积核,256个通道
  6. block4:包含3个卷积层,每个卷积层512个通道
  7. block5:包含3个卷积层,每个卷积层512个通道
  8. fc1:第一个全连接层,设置4096个神经元
  9. fc2:设置4096个神经元
  10. fc3:1000个神经元
    总体上,通道数不断增加,图像尺寸不断减小。